ORGANISATION MONDIALE DE LA PROPRIETE INTELLECTUELLE 
Bureau international 




PCX 

DEMANDE INTERNATIONALE PUBLIEE EN VERTU DU TRAITE DE COOPERATION EN MATIERE DE BREVETS (PC7D 



(51) Classification Internationale des brevets ^ : 

C12N 15/13, A61K 39/395, 48A)0, C07K 
16/18, C12N 15/86, GOIN 33/577, 33/68, 
C12Q 1/68, C12N 15/12 



Al 



(11) Niunero de publication Internationale: WO 97/17445 

(43) Date de publication Internationale: 15 mai 1997 (15.05.97) 



(21) Num^ro de la demande Internationale: PCT/FR96/01773 

(22) Date de d^p6t international: 8 novcmbre 1996 (08.1 1.96) 



(30) Donn^ relatives k la priority: 

95/13576 10 novcmbre 1995 (10.11.95) FR 



(71) D^posants (pour tous les Etats designes sauf US): CEN TRE 

NATIONAL DE LA RECHERCHE SCIENTIFIQUE 
(CNRS) [FR/FR); 3, rue Michel-Ange, F-75016 Paris 
(FR). INSTITUT NATIONAL DE LA SANTE ET DE LA 
RECHERCHE MEDICALE (INSERM) [FR/FR]; 101. rue 
de Tolbiac, F-75013 Paris (FR). 

(72) Inventeurs; et 

(75) Inventeurs/D^posants (US seulement): TORA, Lazslo 
[FR/FRl; 14. rue des Primevdrcs, F-67880 Krautcrgersheim 
(FR). LUTZ, Yves fFR/FRl; 12, rue d'Ypr^s, F-67000 
Strasbourg (FR). TROTTIER, Yvon [FR/FR]; 9. rue Kuhn. 
F-67000 Strasbourg (FR). MANDEL, Jean-Louis [FR/FRl; 
9, rue du Barrage, F-67300 Schiltighcim (FR). 

(74) Mandataires: PEAUCELLE. Chantal etc.; Cabinet Armengaud 
Aind, 3, avenue Bugeaud, F-751 16 Paris (FR). 



(81) Etat5 d^sign^s: CA, JP, US. brevet europ^en (AT, BE, CH, 
DE, DK, ES. FI. FR, GB, GR, IE, IT. LU. MC, NL, PT, 
SE). 



Public 



Avec rapport de recherche internationale. 

Avant I' expiration du delai prevu pour la modification des 

revendications, sera republi^e si de telles modifications sont 

revues. 



(54) TiUe: NEURODEGENERATTVE DISEASE TREATMENT AND DIAGNOSTIC MEANS 



(54) Titre: MOYENS POUR LE TRAITEMENT ET LE DIAGNOSTIC DE MALADIES NEURODEGENERATIVES 



(57) Abstract 

Means for treating and diagnosing neurodegenerative diseases related to the presence of polyglutamine chains by means of a 1C2 
antibody are disclosed. 

(57) Abr^g^ 

La prtfsente invention conceme des moyens pour Ic traitement ei le diagnostic des maladies neurodegeneratives associ^es ^ la presence 
de chaines polyglutaminiques, mettant en ocuvre un anticorps 1C2. 



BNSOOCID' <WO 9717445A1> 



USIQUEMEST A TfTRE D* IN FORMATION 



Codes utilises pour identifier les Etats parties au PCT, sur les pages de couverturc des brochures publiant 
des demandcs intemationales en vcrtu du PCT. 



AT 


Arm6nie 


GB 


Royaume-Unt 


MW 


MaJawi 


AT 


Autrichc 


GE 


G^orgie 


MX 


Mexiquc 


AU 


Australie 


GN 


Garnet 


NE 


Niger 


BB 


Baitwle 


GR 


Grtce 


NL 


Pays-Bas 


BE 


Belgique 


HU 


Hongric 


NO 


NoTvftge 


BF 


Burkina Paso 


IE 


Irlandc 


NZ 


Nouvelle-ZAlande 


BG 


Bulgahe 


IT 


Italic 


PL 


Poiogne 


BJ 


B£nm 


JP 


Japon 


PT 


Portugal 


BR 


Bresil 


KE 


Kenya 


RO 


Roumanic 


BY 


B^lanis 


KG 


Kirghiz istan 


RU 


F^d^raiion de Russie 


CA 


Canada 


KP 


R^publique populairc dtfmocraiique 


SO 


Soudan 


CF 


R£publique centrairicaine 




de Cor6c 


SE 


Su6dc 


CG 


Congo 


KR 


R6publiqiie de Cor^e 


sc 


Singapour 


CH 


Suisse 


KZ 


Kazakhsuu) 


SI 


Slov^nic 


CI 


C6tc d'lvoire 


LI 


LiechtenMcin 


SK 


Stovaquie 


CM 


Cameroun 


LK 


Sri Lanlca 


SN 


S^n^gal 


CN 


Chine 


LR 


Liberia 


sz 


Swaziland 


cs 


Tch6coslovaqu ie 


LT 


Lituanie 


TD 


Tchad 


cz 


R^publique tchfcque 


LU 


Luxembourg 


TC 


Togo 


DE 


Allentagne 


LV 


Lcctonie 


TJ 


Tadjikistan 


DK 


Danemaric 


MC 


Monaco 


TT 


Triniti^t-Tobago 


EE 


Estcnie 


MD 


R^publique de Moldova 


UA 


Ukraine 


ES 


Eapagne 


MG 


Madagascar 


UG 


Ouganda 


Fl 


Finlande 


ML 


Malt 


LS 


Elais-Unis d'Am^riqtie 


FR 


France 


MN 


Mongolie 


L'Z 


Ouzbdcistan 


GA 


Gabon 


MR 


Mauri tan ic 


VN 


Vtci Nam 



wo 97/17445 PCT/FR96/01773 

MOYENS POUR I-E TRAITEMENT ET LE DIAGNOSTIC 
DE MALADIES NEURODEGENERATIVES 

La presente invention concerne des moyens pour 
le traiteitvent et le diagnostic de maladies 
neurodegeneratives. Elle concerne plus particulierement 
1 ' utilisation d'un anticorps monoclonal capable de 
5 reconnaltre et d'inactiver les chaines homopolymeres de 
glutamines dans les proteines specif iquement associees a 
ces maladies. 

La presence de sequences repetees dans I'ADN 
est un phenomene connu . Ces sequences peuvent etre de 

10 differentes natures comme des sequences signal ou 
enhancer. II peut egalement s*agir de sequences codant 
pour un homopclymere faisant parrie d'une structure 
proreique ce plus grande taille. 

Dans le cas precis de la maladie de Huntington 

15 ii s'agit d'une sequence repetee de codcns CAG codant 
pour une chaine homopolymere de glutamine 
(polyglucamine) . II a ete mcntre que cette sequence est 
bien exprimee dans les proteines traduites. L ' implication 
de ces proteines dans le . declenchement ou le 

20 developpement de la maladie depend essentiellement du 
nombre de residus glutamine enchalnes dans la proteine. 
Plus celui-ci est important plus la maladie sera severe 
et precoce . 

On a pour 1^ instant denombre au moins cinq 
25 maladies neurodegeneratives humaines genetiques 

associees a la presence de ces chaines de residus 
glutamine : I'atrophie musculaire spino-bulbaire associee 
au chromosome X ou maladie de Kennedy, la maladie de 
Huntington dominante autosomale, I'ataxie 

30 spinocerebeileuse de type 1, I'atrophie dentarorubral- 
pallidoluys ienne et I'ataxie spinocerebeileuse de type 3 
ou maladie de Machado- Joseph . Dans les genes codant pour 
les proteines responsables de ces maladies, le nombre de 
triplets CAG repetes est tres variable. Par exemple'dans 
35 le gene responsable de la maladie de Huntington, ce 

FEUILLE DE REMPLACEMENT (REGIE 26) 
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nombre varie, entre 10 et 35 unites chez- les sujets non 
attein.ts et de 37-40 jusqu'a 60-120 chez les malades. De 
plus chez les malades, on observe une instabilite de ce 
nombre de repetitions d'une generation a 1' autre. Une 
explication a cette variabilite repose sur les phencmenes 
de recombinaison et replication se produisant lors des 
divisions cellulaires au cours de la gaiuetogenese . Ces 
phenomenes peuvent soit conduire a une augmentation du 
nombre de repetitions soit, plus rarement, a une 
diminution. Dans la plupart des cas le nombre de triplets 
CAG augmente chez les descendants et 1 ' on observe que 
cette amplification de taille se fait surtout sur les 
alleles paternels du gene concerne . Le nombre de 
recombinaisons subies par I'ADN lors de la spermatogenese 
est en effet plus eleve que celui des recombinaisons 
survenant lors de l*ovogenese. Ceci est du au nombre tres 
eleve de divisions survenant au cours de la 
spermatogenese. 

Une etude realisee au sein de plusieurs 
families atteintes de la maladie de Huntington, a permis 
de comparer sur plusieurs generations quelques parametres 
tels que la longueur de ces sequences repetees, I'age 
auquel se developpe la maladie et la severite de celle- 
ci. Les resultats obtenus font apparaitre une correlation 
inverse entre le nombre de triplets CAG (determinant la 
longueur de la chaine polyglutamine ) d'une part et 1 ' age 
d* apparition et la gravite des symptomes d- autre part. 
Ceci permet d'expliquer la . plus grande precocite et la 
plus grande severite de ces maladies de generation en 
generation . 

A ce jour il n'existe aucun outil therapeutique 
pour le traitement de la maladie de Huntington et d*une 
maniere generale des maladies neurodegeneratives 
associees a une repetition de glutamine. 
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La presente invention a ainsi pour objet de 
proposer une methode de traitement de ces maladies. Elle 
est fondee sur 1 * utilisation d ' un anticorps capable de se 
fixer sur les formes pathogenes des proteines 
5 responsables des maladies asscciees a une repetition de 
glutamine . 

Pius precisement/ la demanderesse s'est 
interessee a la caracterisation d'un systeme capable de 
se lier in vitro a des chalnes polyglutamine dont la 

10 longueur correspond a celle presente dans les proteines 
responsables de maladies neurodegeneratives. Ceci l*a 
conduit a rechercher un anticorps monoclonal a meme de 
reconnaitre specif iquemenr les chalnes polyglutamine 
contenanu un nombre de residus superieur a 37 ce qui 

15 correspond a la valeur limite inferieure de la longueur 
de la chaine polyglutamine dans les proteines pathogenes. 

De maniere inattendue,. la demanderesse a mis en 
evidence qu ' un anticorps monoclonal specif ique, 

1' anticorps monoclonal 1C2 (mAclC2) s'avere capable de 

20 discriminer les proteines pathogenes des proteines 
normales en fonction de la longueur de ieurs chaines 
polyglutamines respectives . 

anticorps monoclonal 1C2 est deja connu pour 
son affinite pour un facteur de transcription se liant 

25 aux sequences TATA ( TATA-binding protein : TBP) . Jusqu'a 
present le peptide LEEQQRQQQQQQ, localise a I'extremite 
N-terminale de la chaine homopolymere de glutamine de la 
TBP,, etait considere comme 1' epitope pour lequel 
1' affinite de cet anticorps etait la plus importante 

30 (Lescure A et al . EMBO Journal 13, 1166-1175 (1995)). 

De maniere tout a fait surprenante la 
demanderesse a montre que cet anticorps possedait en fait 
une tres forte affinite pour les sequences polyglutamines 
meme en 1' absence du peptide decrit ci-dessus. Cette 

35 affinite est, de plus, proportionnelle a la longueur de 
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la chaine polyglutamine . Son af finite pour ces dernieres 
est d'autant plus importante que les chaines sont 
longues . Pour les chaines de longueur normale elle est 
nulle pour un temps d' exposition normal a I'anticorps et 
5 tres faible si 1 ' on augmente cette duree. De ce fait 
I'anticorps 1C2 est capable de reconnaitre les longues 
chaines polyglutamines des alleles mutes des proteines 
responsables de la maladie de Huntington et des ataxies 
spinocerebelleuses 1 et 3 comme epitope pathologique . 

10 Avantageusement / 11 permet le diagnostic precoce des 
sujets qui vont developper I'une de ces maladies ainsi 
que des families a risques qui expriment des proteines 
dont la chaine polyglutamine comprend un nombre de 
residus a la limite du pathologique. 

15 L'anticorps monoclonal 1C2 reconnait 

specif iquement les formes pathologiques des proteines 
pathogenes dans la maladie de Huntington et les maladies 
associees a une repetition de triplets. II peut etre 
utilise afin d'inactiver specif iquement les formes 

20 pathogenes de ces proteines, la liaison de iC2 pouvant 
ent ralner 

- un changement de conformation de la proteine 
lui faisant perdre ses proprietes pathogenes, ou, 

- une plus grande sensibilite aux systemes de 
25 degradation aussi bien intracellulaires 

qu' extracellulaires . 

Un premier objet de la presente invention est 
par consequent 1 ' utilisation de I'anticorps 1C2 ou d'un 
fragment ou d'un derive de I'anticorps 1C2 pour la 
30 preparation d'une composition pharmaceutique destinee au 
traitement preventif ou curatif des maladies 
neurodegeneratives associees a une repetition de 

glutamine. 

Les fragments ou derives d'anticorps sont par 
35 exemple les fragments Fab ou F(ab)'2, les regions VH ou 
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VL d'un anticorps ou encore des anticorps simple chaine 
(ScFv). comprenant une region VH liee a une region VL par 
un bras, Ce type de domaine est particulierement 
avantageux puisqu'il peut etre dirige contre toute 
5 molecule. 

Les anticorps, molecules de la superfamille des 
immunoglobulines; sont constitues de differentes chaines 
(2 lourdes (H) et 2 legeres (L) ) ■ elles-memes composees de 
differents domaines (domaine variable (V) domaine de 

10 jonction (J), etc). Le fragment ou derive d'anticorps 
selon 1' invention comprend au moins le site de liaison de 
1 '.anticorps aux sequences polyglutamines . Ce fragment 
peut etre soit le domaine variable d'une chaine legere 
(Vl) ou lourde (Vh) , eventuellement sous forme de 

15 fragment Fab ou F(abM2 ou, pref erentiellement , sous 
forme d' anticorps simple chaine (ScFv) . Les anticorps 
simple chaine sont constitues d'un peptide correspondant 
au site de liaison de la region variable de la chaine 
legere d'un anticorps relie par un bras peptidique a un 

20 peptide correspondant au site de liaison de la region 
variable de la chaine lourde d'un anticorps. La 
construction de sequences d'acides nucleiques codant pour 
de tels anticorps modifies selon 1' invention a ete 
decrite par exemple dans le brevet US 4 946 778 ou dans 

25 les demandes WO 94/02610, WO 94/29446, Ce type de 
molecule c'est-a-dire comprenant le site de liaison de la 
region variable de la chaine legere de 1* anticorps 1C2 
relie par un bras peptidique au site de liaison de la 
region variable de la chaine lourde de 1' anticorps 1C2, 

30 constitue egalement un objet de la presente invention. 

Pour ■ inactiver lesdites proteines pathogenes 
1' anticorps peut etre administre tel quel dans le systeme 
nerveux des patients, par vole stereotaxique . Dans ce cas 
1' anticorps - sera dirige contre les molecules 

35 pathologiques produites par les cellules malades. La 
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fixation de I'anticorps entralne 1 ' inactivation de ces 
prcteines, et entraine leur degradation et permet aussi 
d'eviter leur accumulation a I'interieur ou I'exterieur 
des cellules, une des causes possibles de la maladie. Ces 
5 anticorps ou des fragments des ces anticorps peuvent 
egalement penetrer a I'interieur des cellules et ainsi 
inactiver les proteines qui • ne sont pas secretees. lis 
sent particulierement avantageux pour le traitement des 
maladies telles que par exemple la maladie de Huntington, 
10 I'ataxie spinocerebel leuse de type 1, 2 ou 3, I'atrophie 
musculaire spino-bulbaire associee au chromosome X ou 
maladie de Kennedy, I'atrophie dentarorubral- 
pallidoluysienne et I'ataxie spinocerebelleuse autosomale 
dominante . 

15 Un autre mode d' utilisation de I'anticorps 

consiste a le faire agir directement a I'interieur de la 
cellule. Pour ce faire on utilise les methodes connues de 
transfert de genes. Un mode particulier de realisation de 
1' invention consiste a faire exprimer dans les cellules 

20 du patient un acide nucleique codant pour I'anticorps 1C2 
ou pour un fragment ou derive 1* anticorps 1C2 comme par 
exemple un fragment ScFv, de cet anticorps. 

La sequence d'acides nucleiques codant pour 
I'anticorps 1C2 ou un fragment ou un derive de 

25 I'anticorps 1C2 peut etre administree telle quelle, sous 
forme d'ADN nu selon la technique decrite dans la demande 
WO 90/11092. Elle peut egalement etre administree sous 
forme complexee, par exemple avec du DEAE-dextran (Paganc 
et al., J. Virol. I (1967) 891), avec des proteines 

30 nucleaires (Kaneda et al., Science 243 (1989) 375), avec 
des lipides (Feigner et al., PNAS 84 (1987) 7413), sous 
forme de liposomes (Fraley et al,, J Biol Chem. 255 
(1980) 10431), etc. Pref erentiellement , la sequence 
utilisee dans le cadre de 1' invention fait partie d'un 

35 vecteur. L'emploi d'un tel vecteur permet en effet 
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d'ameiiorer 1 ' administration de 1 ' acide nucleique dans 
les cellules a trairer, et egalement d'augmenter sa 
stabilite dans lesdites cellules, ce qui permet d'obtenir 
un effet therapeutique durable. De plus, il est possible 
5 d^introduire plusieurs sequences d'acide nucleique dans 
un meme vecteur, ce qui augmente egalement I'efficacite 
du traitement. 

Le vecteur utilise peut etre d'origine diverse, 
des lors qu'il est capable de transformer les cellules 

10 animales, de preference les cellules humaines . Dans un 
mode prefere de mise en oeuvre de 1' invention, on utilise 
un .vecteur viral, qui peut etre chois parmi les 
adenovirus, les retrovirus, les virus adeno-associes 
(AAV) ou le virus de 1' herpes. 

15 A cet egard, la presente invention a egalement 

pour objet tout virus recombinant comprenant, insere dans 
son genome, un acide nucleique codant pour un fragment 
ScFv de I'anticorps 1C2 . Pref erentiellement , les virus 
utilises dans le cadre de 1' invention sent defectifs, 

20 c'est-a-dire qu'ils sont incapables de se repliquer de 
f agon . autonome dans la cellule infectee, Generalement , 
le genome des virus defectifs utilises dans le cadre de 
la presente invention est done depourvu au moins des 
sequences necessaires a la replication dudit virus dans 

25 la cellule infectee. Ces regions peuvent etre soit 
eliminees (en tout ou en partie) , soit rendues non- 
f onctionnelles , soit substituees par d'autres sequences 
et notamment par la sequence codant pour un fragment ScFv 
de I'anticorps 1C2 . Pref erentiellement , le virus defectif 

30 conserve neanmoins les sequences de son genome qui sont 
necessaires a 1 ' encapsidation des particules virales. 

S'agissant plus particulierement d' adenovirus, 
differents serotypes, dont la structure et les proprietes 
varient quelque peu, on ete caracterises . Parmi ces 

35 serotypes, on prefere utiliser dans le cadre de la 
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presente invention les adenovirus huiuains de type 2 ou 5 
(Ad 2. ou Ad 5) ou les adenovirus d'origine animale (voir 
demande WO 94/26914). Parmi les adenovirus d'origine 

animale utilisables dans le cadre de la presente 
5 invention on peut citer les adenovirus d'origine canine, 
bovine, murine/ (exemple : Mavl, Beard et al., Virology 
75 (1990) 81), ovine, porcine, aviaire ou encore simienne 
(exemple SAV) . De preference, I'adenovirus d'origine 
animale est un adenovirus canin, plus pref erentiellement 

10 un adenovirus CAV2 [(souche manhattan ou A26/61 (ATCC VR- 
800) par exemple]. De preference, on utilise dans le 
cadre de 1' invention des adenovirus d'origine humaine ou 
canine ou mixte . 

Pref erentiellement , les adenovirus defectifs de 

15 1' invention comprennent les ITR, une sequence permettant 
1 * encapsidation et la sequence codant pour un fragment 
ScFv de I'anticorps 1C2 . Encore plus pref erentiellement , 
dans le genome des adenovirus de 1* invention, la region 
El au moins est non f onctionnelle . Le gene viral 

20 considere peut etre rendu non fonctionnel par toute 
technique connue de 1 ' homme du metier, et notamment par 
suppression totale, substitution, deletion partielle, ou 
addition d'une ou plusieurs bases dans le ou les genes 
consideres. De telles modifications peuvent etre obtenues 

25 in vitro (sur de I'ADN isole) ou in situ , par exemple, 
aux moyens des techniques du genie genetique, .ou encore 
par traitement au moyen d' agent mutagenes. D'autres 
regions peuvent egalement etre modifiees, et notamment la 
region E3 (WO 95/02697), E2 (WO 94/28938), E4 (WO 

30 94/28152, WO 94/12649, WO 95/02697) et L5 (WO 95/02697). 
Selon un mode prefere de mise en oeuvre, 1* adenovirus 
selon IMnvention comprend une deletion dans les regions 
El et E4. Dans les virus de 1 * invention, la deletion dans 
la region El s'etend pref erentiellement des nucleotides 

35 455 a 3329 sur la sequence de 1' adenovirus Ad5. 
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Les adenovirus recombinants . defectifs selon 
i ' invention peuvent etre prepares par toute technique 
connue de 1 ' homine du metier (Levrero et al . , Gene 101 
(1991) 195, EP 185 573; Graham, EMBO J. 3 (1984) 2917) . 
5 En particulier , . iis peuvent etre prepares par 
recombinaison homoiogue entre un adenovirus et un 
plasmide portant entre autre la sequence d'ADN codant 
pour un fragment ScFv de I'anticorps 1C2 . La 
recombinaison homoiogue se produit apres co- transf ection 

10 desdits adenovirus et plasmide dans une lignee cellulaire 
appropriee. La lignee cellulaire utilisee doit de 
preference (i) etre crans f ormable par lesdits elements, 
et (ii), comporter les sequences capables de complementer 
la partie du genome de 1' adenovirus defectif, de 

15 preference sous forme integree pour eviter les risques 
de recombinaison. A titre d'exemple de lignee, on peut 
mentionner la lignee de rein embryonnaire humain 293 
(Graham et al J. Gen. Virol. 36 (1977) 59) qui contient 
notamment, integree dans son genome, la partie gauche du 

20 genome- d'un adenovirus AdS (12%). Des strategies de 
construction de vecteurs derives des adenovirus ont 
egalement ete decrites dans les demandes n'^FR 93 05954 et 
FR 93 08596. 

Ensuite, les adenovirus qui se sont multiplies 
25 sont recuperes et purifies selon les techniques, 
ciassiques de biologie moleculaire, comme illustre dans 
les exemples. 

Concernant les virus adeno-associes (AAV) , il 
s*agit de virus a ADN de taille relativement reduite, qui 
30 s'integrent dans le genome des cellules qu'ils infectent, 
de maniere stable et site-specif ique . lis sont capables 
d'infecter un large spectre de cellules, sans induire 
d'effet sur la croissance, la morphologie ou la 
dif f erenciation cellulaires. Par ailleurs, ils ne 
35 semblent pas impliques dans des pathologies chez I'homme. 
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Le genome des AAV a ete clone, sequence et caracterise. 
II comprend environ 4700 bases, et contient a chaque 
extremite une region repetee inversee (ITR) de 145 bases 
environ, servant d'origine de replication pour le virus. 
5 Le reste du genome est divise en 2 regions essentielles 
portant les fonctions d ' encapsidation : la partie gauche 
du genome, qui contient le gene rep implique dans la 
replication virale et 1' expression des genes viraux, la 
partie droite du genome, qui contient le gene cap codant 

10 pour les proteines de capside du virus, 

L ' utilisation de vecteurs derives des AAV pour 
le cransferc de genes in vitro et" in vivo a ete decrite 
dans la litterature (voir notamment WO 91/18088; WO 
93/09239 ; US 4,797,368. USS. 139.941 EP 488 528). Ces 

15 demandes decrivent differentes constructions derivees des 
AAV, dans lesquelles les genes rep et/ou cap sont deletes 
et remplaces par un gene d'interet, et leur utilisation 
pour transferer in vitro (sur cellules en culture) ou in 
vivo (directement dans un organisme) ledit gene 

20 d'interet. Les AAV recombinants defectifs selon 
1' invention peuvent etre prepares par co-transf ection 
dans une lignee cellulaire infectee par un virus 
auxiiiaire humain (par exemple un adenovirus), d'un 
plasmide contenant la sequence codant pour un fragment 

25 ScFv de I'anticorps 1C2 borde de deux regions repetees 
inversees (ITR) d'AAV. et d'un plasmide portan les genes 
d ' encapsidation (genes rep et cap) d'AAV. Les AAV 
recombinants produits sont ensuite purifies par des 
techniques classiques . 

30 Concernant les virus de 1' herpes et les 

retrovirus, la construction de vecteurs recombinants a 
et:e largement decrite dans la litterature voir notamment 
Breakfield et al . , New Biologist 3 (1991) 203 : EP 
453242, EP178220, Bernstein e" al. Genet. Eng. 

35 7 (1985) 235:Mc Cormick, BioTechnology 3(1985)689, etc. 
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En particulier, les retrovirus, sont des virus 
integratifs, infectant selectlvement les cellules en 
division. lis constituent done des vecteurs d'mteret 
pour des applications cancer. Le genome des retrovirus 
5 comprend essentiellement deux ' LTR, une sequence 
d' encapsidation et trois regions codantes (gag. pol et 
env) . Dans les vecteurs recombinants derives des 
retrovirus, les genes gag, pol et env sont generalement 
deletes, en tout ou en partie, et remplaces par une 

10 sequence d'acide nucleique heterologue d'interet. Ces 
vecteurs peuvent etre realises a partir de differents 
types de retrovirus teis que notainiuent le MoMuLV ("murine 
moloney leukemia virus" : encore designe MoMLV) . le MSV 
("murine moloney sarcomavirus " ) , le HaSV ("harvey sarcoma 

15 virus"), le SNV ("spleen necrosis virus") ; le RSV ("rous 
sarcoma virus") ou encore le virus de Friend. 

Pour construire des retrovirus recombinants 
selon 1 ' invention comportant un acide nucleique selon 
1* invention, un plasmide comportant notamment les LTR,. la 

20 sequence d ' encapsidation et ledit acide nucleique est 
construit, puis utilise pour transfecter une lignee 
cellulaire dite d * encapsidation, capable d'apporter en 
trans les fonctions retrovirales deficientes . dans le 
plasmide. Generalement, les lignees d ' encapsidation sont 

25. done capables d'exprimer les genes gag. pol et env. De 
telles lignees d* encapsidation ont ete decrites dans 
. . I'art anterieur, et notamment la lignee PA317 
(US4, 861, 719) , la lignee PsiCRIP (WO90/02806) et la 
lignee GP+envAm-12 (WO89/07150) . Par ailleurs, les 

30 retrovirus recombinants peuvent . comporter des 
modifications au niveau des LTR pour supprimer I'activite 
transcriptionnelle, ainsi que des sequences 

d' encapsidation etendues, comportant une partie du gene 
gag (Bender- et al., J. Virol 61 (1987) 1639). Les 
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retrovirus recombinants produits sent ensuite purifies 
par das techniques classiques. 

Pour la mise en oeuvre de la presente 
invention, ii est tout part iculierement avantageux 
5 d'utiliser un adenovirus ou un retrovirus recombinant 
defectif. Ces vecteurs possedent en effet des proprietes 
particulierement int eressantes pour le transfert de 
genes. adenovirus est particulierement prefere pour le 
transfert de genes dans le systeme nerveux (WO94/08026) . 

10 Avantageusement , dans les vecteurs de 

1' invention, la sequence codant pour un fragment ScFv de 
I'anticorps 1C2 est placee sous le controie de signaux 
permettant son expression dans les cellules nerveuses . 
Pref erentiellement , il s'agit de signaux d'expression 

15 heterologues, c'est-a-dire de signaux differents de ceux 
naturellement responsables de 1* expression de 
I'anticorps. II peut s'agir en particulier de sequences 
responsables de 1' expression d'autres proteines, ou de 
sequences synthe tiques . 

20 Notamment/ il peut s'agir de sequences 

promotrices de genes eucaryotes ou viraux. Par exemple, 
il peut s'agir de sequences promotrices issues du genome 
de la cellule que 1 ^ on desire infecter. De meme, il peut 
s'agir , de sequences promotrices issues du genome d*un 

25 virus, y compris du virus utilise. A cet egard, on peut 
citer par exemple les promoteurs. ElA, MLP, CMV, LTR-RSV. 
etc. En outre, ces sequences d'expression peuvent etre 
modifiees par addition de sequences deactivation,, de 
regulation, ou permettant une expression tissu- 

30 specif ique. 

La presente invention concerne egalement toute 
composition pharmaceutique comprenant soit I'anticorps 
1C2, un fragment ou derive de cet anticorps soit un ou 
plusleurs vecteurs tels que decrits precedemment . Ces 

35 compositions pharmaceut iques peuvent etre formulees en 
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vue d' acdininistrations par voie topiqus/ orale, 
par ente rale, in tr anas ale, intraveineuse , intramusculaire, 
sous - cut anee, intraoculaire, transdermique, intracerebral 
s tereotaxique, etc. De preference, les compositions 
5 pharmaceutiques de 1 ' invention contiennent un vehicule 
pharmaceutiquement acceptable pour une formulation 
injectable, notamment pour une infection directe dans le 
cerveau du patient. II peut s'agir en particulier de 
solutions steriles, isotoniques, ou de compositions 

10 seches, notainment lyophilisees, qui, par addition selon 
le cas d'eau sterilisee ou de seriim physiologique , 
permettenz la constitution de solutes injectables. 
L' injection directe dans le cerveau du patent est 
avantageuse car elle permet de concentrer I'effet 

15 therapeutique au niveau des tissus affectes, 

Les compositions selon 1' invention sont tout 
particulierement utiles pour le traitement des maladies 
neurodegeneratives associees a la presence d ' une proteine 
portant une chaine homopolymere de glutamine. 

20 Les doses de virus recombinant defectif 

utilisees pour 1' injection peuvent etre adaptees en 
fonction de differents parametres, et notamment en 
fonction du vecteur viral, du mode d ' administration 
utilise, de la pathologie concernee ou encore de la duree 

25 du traitement recherchee. D'une maniere generale, les 
adenovirus recombinants selon 1' invention sont formules 
et administres sous forme de doses comprises entre 10'* et 
lO^'^ pfu/mi, et de preference 10^ a 10^° pfu/ml. Le terme 
pfu ("plaque forming unit*) correspond au pouvoir 

30 infectieux d*une solution de virus, et est determine par 
infection d*une culture celluiaire appropriee, et mesure, 
. generalement apres 48 heures, du nombre de plages de 
cellules infectees. Les techniques de determination du 
titre pfu d'une solution virale sont bien documentees 

35 dans la litterature. Concernant les retrovirus, les 
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compositions selon 1' invention peuvent comporter 
direct-ement les cellules product rices / en vue de leur 
implantation . 

Sur le plan therapeut ique il serait egalement 
5 necessaire de disposer d'un outil de diagnostic fiable. 
Un tel outil serait en outre particulierement avantageux 
pour le diagnostic des predispositions familiales a 
developper ce type de maladies. 

La presente invention a done d' autre part pour 

10 objet de proposer une methode de diagnostic de la maladie 
Huntington fondee sur un test biologique, 

La demanderesse s'est egalement interessee a 
d'autres applications possibles de I'anticorps 1C2 dans 
le cadre de 1 ' identification d' agents responsables de 

15 maladies neurodegeneratives, Bien que les symptomes 
cliniques manifestes soient souvent tres differents la 
demanderesse a observe que certaines maladies 
neurodegeneratives presentent en revanche de nombreux 
points communs/ quant a leur mode de developpement , avec 

20 la maladie de Huntington. Ces ressemblances sont surtout 
une apparition des symptomes de plus en plus precoces et 
severes ' au cours des generations, notamment mais pas 
exclusivement par transmission d ' un allele paternel mute. 
Les agents pathologiques responsables de ces maladies ne 

25 sont pas connus et sont souvent dif f icilement 
identif iables . II est particulierement interessant de 
rechercher s ' il existe dans ces maladies un agent 
pathogene ressemblant dans sa structure a la proteine 
responsable de la maladie de Huntington. II est alors 

30 tres avantageux d'utiliser I'anticorps monoclonal 1C2 
pour detecter chez des sujets atteints de ces maladies la 
presence de chaines polyglutamine . Ceci rend possible 
1 * identif ication des proteines portant ces chaines qui 
sont susceptibles d'etre les agents pathalogiques 

35 recherches. 
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1C2 reconnait ainsi les ataxines-1 a 55 
glutamines ou -plus, dans le cas des SCA 1 (ataxie 
spinocerebelleuse 1), et trois proteines (une proteine 
majeure a 68K et deux proteines mineuses a 74K et 87K) , 
5 dans le cas des SCA3 (Maladie de Machado- Joseph) . 

L'anticorps 1C2 permet, en outre, 

avantageusement de differencier une SCA2 (ataxie 
spinocerebelleuse de type 2) d'une ADCA II (ataxie 
cerebelleuse autosomale dominante de type II) en 

10 distinguant les proteines impliquees dans les phenotypes 
respectifs (proteine de 130K environ pour ADCA II, 
proteine de 150K environ, pour SCA2, poids moleculaires 
estimes par migration electrophoretique ) . 

1C2 peut ainsi avantageusement permettre 

15 d' identifier les formes pathogenes des proteines 
impliquees dans toute maladie neurodegenerative a 
anticipation prouvee ou suggeree, telle que les ADCA de 
type I (SCA4, SCA5 par exemple) , AD-FSP (paraplegie 
spastique familiale} ou bien encore dans certaines formes 

20 et dans certains cas de maladies affectives bipolaires 
(psychoses maniaco-depressives ) ou de schizophrenie . 

L ' identification des proteines responsables de 
ces maladies permet d'acceder a I'etape de sequengage. 
L' invention fournit alors les moyens de construire des 

25 sondes d*ADN appropriees, pour 1 ' identification du gene 
responsable et la mise en oeuvre de traitements- de 
therapie genique tels que decrit ci-dessus. 

Apres avoir caracterise I'anticorps 1C2 et 
montre qu'il detecte de maniere specif ique sur transferts 

30 Western les proteines pathologiques presentes chez les 
patients atteints de HD, de SCAl et de SCA5, la 
demanderesse a egalement demontre que des proteines 
anormales etaient presentes dans des patients de families 
SCA2 ou SCAT, 
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Ceci est en tres bonne correlation avec ies 
observations cliniques d ' anticipation chez ces families. 
La proteine SCA2 mutante est cytoplasmique avec une masse 
moleculaire apparente de 150 kDa environ alors que la 
5 proteine SCA7 est nucleaire avec une masse moleculaire 
d* environ 130 kDa. 

La demanderesse a alors utilise les proprietes 
surprenantes et avantageuses de I'anticorps 1C2 pour 
isoler, par criblage d' expression, des genes impliques 
10 dans des maladies a extensions polyglutaminiques . 

En plus de trois genes connus, 1C2 a ainsi 
permis, par criblage de banques d' expression ADNc, de 
doner puis de sequencer 6 nouveaux genes contenant des 
repetitions CAG et pouvant etre impliques dans des 
15 maladies a chaines polyglutaminiques (motifs codants les 
chalnes polyglutaminiques de ces genes en SEQ ID n'^l a 6 
et ADNc de SCA2 en entier en SEQ ID n°7) . 

Ces six nouveaux genes ne presentent que de 
tres faibles homologies avec les genes connus . 
20 Un de ces nouveaux genes (SEQ ID n''7 et 3) 

porte une mutation chez les patients atteints d'ataxie 
spinocerebelleuse de type 2 (SCA2) , c'est-a-dire liee au 
chromosome 12q. Ce gene presente une expression 
ubiquitaire, 

25 L' invention, objet de la presente demande, a 

done egalement pour objet six nouveaux genes susceptibles 
d'etre impliques dans des maladies neurodegeneratives ou 
psychiatriques a chaines polyglutaminiques, et, en 
particulier le gene implique dans- I'ataxie 

30 spinocerebelleuse de type 2 (gene SCA2) . 

Les alleles impliques dans SCA2 ont, dans leur 
forme normale, de 17 a 29 triplets CAG repetes entre 
lesquels s * intercalent de 1 a 3 triplet (s) CAA. 

Dans leur forme mutee, ies alleles impliques 

35 dans SCA2 presentent chez les patients etudies de 37 a 50 
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triplets CAG repetes, ce nombre n'etant pas limitatif et 
etant en tout etat de cause s-uperieur a 30 triplets. lis 
apparaissent comme particulierement instables lors des 
transmissions a la fois paternelles et maternel les . La 
sequence de trois d'entre eux presente des chaines 
purement CAG, 

Le fait qu'une correlation inverse 
particulierement abrupte soit observee entre 1 * age ou se 
declare la maladie et le nombre de repetitions CAG 
suggere une plus grande sensibilite a la longueur des 
chaines polyglutaminiques pour SCA2 que pour les autres 
maladies liees a une extension polyglutaminique , 

Les experiences precedentes en transferts 
Western suggeraient que le seuil inferieur de detection 
en utilisant I'anticorps 1C2 etait d' environ 30 
glutamines. 

De maniere surprenante et inattendue, 1C2 a 
permis de doner des ADNc codant pour des chaines de 
seulement 12 a 26 glutamines. 

Cela pourrait etre du a une plus forte 
sensibilite du clonage d'expression (plus forte abondance 
locale de proteines cibles et plus faible complexite des 
autres proteines)/ et/ou a une difference dans les 
conditions pour la reaction antigene/anticorps {pas de 
denaturation par le SDS dans le criblage des colonies) . 

En consequence 1 ' utilisation de I'anticorps 
monoclonal 1C2 se generalise au diagnostic precoce de 
sujets susceptibles de developper toute maladie 
neurodegenerative liee a I'expression .d'une proteine 
ayant dans sa structure une longue chaine polyglutamine, 
ainsi que des families a risques qui expriment des 
proteines dont la chaine polyglutamine comprend un nombre 
de residus a la limite du pathologique . Ce diagnostic 
peut utiliser directement I'anticorps 1C2 ou se faire par 
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analyse de I'ADN au niveau de genes codant pour des 
polyglutamines, genes identifies grace a I'anticorps 1C2 . 

Pour proceder a ' ces differents diagnostics, on 
utilise un anticorps monoclonal 1C2 . Cet anticorps est 
5 mis en contact avec un extrait cellulaire obtenu a partir 
de cellules du patient exprimant la proteine recherchee . 
L' anticorps interagit avec cette proteine au niveau de 
1' epitope represents par la longue chaine polyglutamine . 
Les complexes Anticorps-Antigenes sont ensuites reveles 

10 par tout moyen connu de I'homme du metier (marquage de 
1' anticorps, utilisation d'un deuxieme anticorps 
fluorescent " anti-lC2, ELISA, etc.). L'intensite de 
1 ' interaction est determinee. C'est en fonction de cette 
derniere que 1 ' on peut etablir le diagnostic. 

15 1C2 peut egalement etre utilise pour la 

localisation subcellulaire des formes pathologiques des 
proteines impliquees dans la maladie, pour suivre leur 
accumulation ou 1 ' accumulation de leurs produits 
degradation . 

20 La methode objet de la presente invention ouvre 

la voie a de nouvelles methodes de traitement des 
maladies neurodegeneratives basees sur une meilleure 
connaissance des proteines pathologiques qui en sont 
responsables . 

25 L' invention objet de la presente demande, porte 

non seulement sur 1 ' utilisation des proprietes nouvelles 
de 1' anticorps 1C2 et sur les proteines impliquees dans 
la pathogenicite des maladies neurodegeneratives a 
chaines polyglutaminiques/ mais aussi sur de nouveaux 

30 genes egalement impliques dans ces maladies. 

Les six nouveaux genes pouvant etre impliques 
dans des maladies neurodegeneratives a chaines 
polyglutaminiques selon 1' invention, gene SCA2 inclus, 
sont d'une importance cruciale pour la comprehension des 

35 mecanismes de pathogenicite de ces maladies. 
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lis permettent la mise au point directe de 
sondes. d'acides nucleiques, eventuellement marquees de 
maniere a permettre la detection des formes normales ou 
mutees de ces genes, capables de s'hybrider avec les 
5 acides nucleiques (ADN ou ARN} impliques dans ces 
maladies neurodegeneratives a chaines polyglutaminiques . 

De telles sondes nucleiques sont 

parciculierement utiles pour le suivi des families a 
risques, le conseil genetique prenatal et la 

10 discrimination entre les differentes maladies 
neurodegeneratives, certaines d' entre elles pouvant 
presenter des symptomes proches . 

La presente demande a done egalement pour objet 
de relies sondes nucleiques., portant eventuellement une 

15 substitution chimique, sous forme libre ou associee, des 
compositions pharmaceutiques les renfermant dans un 
tampon approprie, une methode in vitro de diagnostic 
et/ou de conseil genetique mettant en oeuvre lesdites 
sondes a I'aide d'une technologie telle que PGR, RT-PCR, 

20 et des kits de diagnostic comprenant lesdites sondes, 

De telles sondes, selon 1' invention, peuvent 
egalement servir de vecteurs de substances 
medicamenLeuses pour delivrer lesdites substances 
medicamenteuses au niveau des zones presentant lesdits 

25 genes, sous leur forme normale ou pathologique . 

Les nouveaux genes selon 1' invention permettent 
egalement la mise au point directe d' acides nucleiques 
anti-sens (ADN ou ARN) utiles comme medicaments, dans.le 
traitement de maladies neurodegeneratives. 

30 La presente demande vise done egalement de tels 

acides nucleiques anti-sens, portant eventuellement, le 
cas echeant, une substitution chimique, sous forme libre 
ou associee, eventuellement inclus, encapsule ou adsorbe, 
des compositions pharmaceutiques les renfermant dans un 
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tampon approprie, et des kits a usage therapeutique 
comprenant lesdits acides nucleiques anti-sens. 

La presents demande porte ncn seulement sur 
lesdits nouveaux genes, sondes nucleiques, acides anti- 
5 sens selon 1* invention mais aussi sur tout acide 
nucleique presentant une homologie superieure ou egale a 
50% avec ces produits, sur tout fragment de ces produits, 
et sur toute banque d' acides nucleiques obtenues par 
criblage d' expression a 1 ' aide de I'anticorps 1C2 de 

10 lignees cellulaires, issues de patients ou d*animaux 
atteints d'une maladie neurodegenerative. 

La presente demande vise egalement un precede 
d ' identification ou de purification de proteines a 
chaines polyglutaitiiniques utilisant une etape 

15 d ' iininunodetection ou d* immunopurif ication par I'anticorps 
1C2, fragment ou derive de cet anticorps, ou pouvant 
conduire secondairement a identifier le gene 
correspondant . 

La presente demande vise enfin une methode de 

20 diagnostic utilisant 1 ' amplification PGR sur ADN ou RT- 
PCR sur ARN permettant de detecter des formes mutees dans 
des genes codant pour des chaines polyglutaminiques 
identifiees ou donees grace a I'anticorps 1C2 . 

La presente invention sera decrite plus en 

25 detail a I'aide des exemples qui vont suivre ■ e-t qui 
doivent* etre consideres comme illustratifs et non 
limitatif s . 

Dans ces exemples, il est fait reference aux 
figures 1 a 8: 

30 - la figure 1 represente le criblage 

d'expression d'une banque d'ADNc en utilisant 

I'anticorps 1C2, 

- la figure 2 represente la detection par PGR 
d' alleles etendus dans une famille SGA2/ 
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la figure 3 represente • les structures 
d' alleles normaux et pathologiques , 

- la figure 4 represente la distribution des 
tallies alleliques au locus 5CA2, 

5 - la figure 5 represente 1 ' instabili te de la 

repetition SCA2 au cours de transmissions de parents a 
enfantS/ 

- la figure 6 represente la correlation entre 
1 ' age de declenchement de la maladie clinique et le 

10 nombre de repetitions, 

- la figure 7 represente la sequence de I'ADNc 

SCA2, et 

la figure 8 represente 1' analyse par 
transfert Northern de 1' expression du gene SCA2 . 

15 

EXEMPLES: 

Techniques generales de biologie moleculaire 

Les methodes classiquement utilisees en 
20 biologie moleculaire telle que la technique de Western 
Blot, le marquage d'anticorps, etc.- sont bien connues 
de I'homine de metier et sont abondamment decrites dans la 
litterature (Maniatis T, et ai . , "Molecular Cloning, a 
Laboratory Manual", Cold Spring Harbor Laboratory, Cold 
25 Spring Harbor, N,Y., 1982; Ausubel F.M., et al, (eds), 
"Current Protocols in Molecular Biology", John Wiley & 
Sons, New York, 1987) . 

Exemple 1: Mise en evidence de I'af finite 

30 specif ique de l^anticorps monoclonal 1C2 pour les 

chaines polyglutamines , 

Afin de mettre en evidence sa capacite a 
reconnaitre des proteines possedant une chaine 
homopolymere- de glutamine, mAclC2 a tout d'abord analyse 
35 en "Western Blot" sur des extraits de lignees cellulaires 



BNSDOCtp- <WO 9717445A1> 



wo 97/17445 



22 



PCT/FR96/01773 



lymphoblastoides (ci-apres LCL) provenant d ' individus 
normaux et d'individus attaints de la maladie de 
Huntington presentant des longueurs variees de chalnes 
polyglutamines dans les HDP (Huntington Disease Protein) . 

Ces differentes proteines sont tout d'abord 
mises au contact d'un anticorps monoclonal anti-HDP. On 
observe lors de 1' analyse en Western Blot que 1 * on 
discrimine tres facilement les proteines normales de 
celles ayant une chalne polyglutamine allongee, grace a 
leur difference de poids moleculaire. Par centre^ lorsque 
le meme lot est analyse avec 1' anticorps monoclonal 1C2, 
seules les proteines HDP a longue chaine polyglutamine 
sont detectees, les proteines normales ne donnant pas de 
reponse. La reponse obtenue avec mAclC2 est specif ique 
des proteines pathologiques . 

II est egalement tres interessant de constater 
que I'intensite du signal depend de la longueur de la 
chaine poluglutamine • Cette intensive est tres forte pour 
les chaines de plus de 50 unites et minimale pour des 
chalnes de 39-40 unites. 

Exemple 2: Mise en evidence d'une correlation 
entre la longueur de la chaine polyglutamine et 
1 ' augmentation de I'af finite de 1C2 pour celle-ci 

Cette relation entre intensite du signal et 
longueur de chaine a ensuite ete examinee a I'aide 
d' echantillons ordonnes en ordre de longueurs de chalnes 
decroissantes en partant du plus grand allele. On observe 
que la valeur de I'af finite de 1' anticorps monoclonal 1C2 
pour les formes mutantes de HDP depend clairement de la 
longueur de la chaine de polyglutamine. En effet, 
I'intensite du signal est plus forte pour les proteines 
ayant une chaine de 60 a 8 5 residus que pour les 
proteines ayant une chaine de 39 ou 40 residus, cette 
derniere etant elle-meme plus forte que celle observee 
pour des chaines plus courtes . 
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On observe egalement qu'une duree d ' exposition 
a I'anticorps prolongee periuet la detection des proteines 
ayant une chaine dont la longueur se situe a la iimite 
superieure des proteines norruales ( > 28 ) . 
5 Une comparaison semi-quantitative de 

I'intensite du signal detecte avec des HDP comprenant 36, 
60 et 85 residus glutamine a ete effectuee a partir d'une 
serie de dilutions d'extraits de LCL. L'intensite du 
signal HDP observee est 2 a 4 fois plus importante avec 
10 des chaines de 85 residus qu'avec des chaines de 60 
residus et de 10 a 20 fois plus importante avec des 
chaines de 60 residus qu'avec des chaines de 39 residus. 

Exemple 3: Mise evidence que 1' epitope reconnu 
15 par mAclC2 est uniquement la chaine polyglutamine 

Lorsqu'on precede au sequencgage de la proteine 
. HDP on remarque que le peptide LEEQQRQQQQQQ de TBP qui 
est reconnu par I'anticorps n'est pas present dans les 
sequences qui entourent la chaine de residus glutamine 
20 dans HDP, On en deduit que 1' epitope de HDP qui est 
reconnu par I'anticorps monoclonal 1C2 est bien 
uniquement la chaine polyglutamine et que I'intensite du 
signal est uniquement dependante de la longueur de celle- 
ci . 

25 Une experience de verification a ete faite avec 

differents alleles de TBP qui possedent egalement des 
chaines polyglutamine dont la longueur varie de 29 a 42 
residus. L' analyse en Western Blot, apres exposition a 
1C2, . a permis de discriminer les alleles en fonction de 

30 leur taille. La aussi I'intensite du signal est plus 
importante avec les chaines de grandes tallies et les 
chaines comprenant entre 27 et 30 residus ne sont pas 
detectees . 

L'anticorps 1C2 est done capable de reconnaitre 
35 specif iquement une sequence polyglutamine. L'intensite du 
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signal obtenu depend de la longueur de ladite sequence 
plus celle-ci est longue plus I'intensite est forte. 

Exemple 4: Detection d'une epitope pathologique 
5 dans les ataxies spinocerebelleules SCAl et SCA3, 

Pour mettre en evidence la capacite de rnAclC2 a 
detecter select ivement d'autres proteines pathogenes 
comprenant une longue chaine polyglutamine/ nous avons 
analyse en Western Blot des extraits de LCL provenant de 

10 patients atteints de SCAl et SCA3 . 

Lors de 1' experience de liaison avec inAclC2, 
une proteine de 100 kD a ete specif iquement detectee dans 
les extraits provenant de patients atteints de SCAl alors 
qu'elle etait absente des extraits provenant de patients 

15 atteints de SCA3 . Cette proteine correspond a 1 ' ataxine 
1, la proteine responsable de SCAl. Inversement , dans les 
extraits de LCL provenant de patients atteints de SCA3 on 
a detecte au moins 4 proteines (une bande majeure 
correspondant a une proteine de . 68 kD et trois bandes 

20 ruineures correspondant a des proteines de 64, 74 et 87 
kD) qui sont absentes des extraits provenant de patients 
atteints de SCAl, Un controle effectue sur 9 LCL 
provenant de sujets sais ne montre aucune de ces bandes. 
Dans tous les cas, aussi bien chez les sujets sains que 

25 chez les sujets atteints, on retrouve une - bande 
correspondant a la TBP et une autre correspondant' a une 
proteine d' environ 230 kD. On peut en conclure que mAclC2 
est specif iquement des proteines responsables de " SCAl et 
SCA3 et peut done etre utilise dans le diagnostic de ces 

30 deux maladies. 

Exemple 5: Mise en evidence de la presence de 
proteine contenant une longue chaine polyglutamine dans 
d'autres maladies neurodegeneratives grace a mAclC2 . 
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Les caracter is tiques pheno typiques coimuunes a 
touces les maladies considerees se retrouvent dans 
d'autres maladies neurodegeneratives coinme I'ataxie 
cerebelleuse autosomale dominante (ADCA) et la paraplegie 
5 spasmodique familiale (FSP) pour lesquelles la/les 
prot:eine(s) responsables ainsi que le(s) gene (si 
correspondant n'ont pas encore ete mis en evidence. 

On a teste en aveugle des extraits de LCL 
provenant de sujets atteints de ces deux maladies, et de 
10 SCAl, SCAB et la maladie de Huntington. 

Sur les 9 LCL testees, 4 mcntrent une bande 
correspondant a une proteine specifique de 130 kD ou de 
150 kD, 3 ne montrent aucun signal specifique ez les deux 
autres presentent des bandes correspondant aux proteines 
15 mutees responsables de SCAl et appartiennent aux temoins. 

Les resultats obtenus ont ete compares aux 
donnees des dossiers medicaux des sujets de Inexperience. 
Les colonnes portant la bande pour une proteine de 130 kD 
correspondent a des echantillons provenant de patients 
20 atteints d'ADCA de type II entrainant une degeneration 
retiniehne. Des experiences de cartographie chromosomique 
ont permis de localiser le gene correspondant a cette 
protein.e de 130 kB sur le chromosome 3p, ce locus 
correspond au locus presume responsable de la maladie. On 
25 a egalement retrouve cette meme proteine dans d' autres 
patients atteints d'ADCA de type II appartenant a 
d' autres families . 

La proteine de 150 kO a ete recherchee chez 
d' autres patients atteints d'ADCA portant une mutation 
30 dans le gene SCA2 ainsi que chez des personnes de la meme 
famille n'ayant pas developpe la maladie. La proteine est 
toujours presente mais chez les sujets sains la longueur 
de la chaine polyglutamine est plus petite et done non 
detectee dans les conditions experimentales telles que 
35 decrites ci-dessus . 



BNSDOCID; <WO 971 7445A1 > 



wo 97/17445 



26 



PCT/FR96/01773 



On peut done en deduire que cette proteine de 
150 • kD est bien responsable d'une maladie 
neurodegenerative associee a 1 ' allongement d'une chaine 
polyglutamine dans une proteine normale qui presents les 
5 memes caracteristiques de transmission que la maladie de 
Huntington . 



Exemple 6: localisation intracellulaire des 
proteines pathologiques . 

10 L'anticorps mAclC2 a egalement ete utilise pour 

determiner la localisation intracellulaire de la proteine 
responsable de SCA3 ainsi que celle des proteines 
nouvellement identifiees et qui sont liees a I'ADCA de 
type II et a SCA2 . 

15 L' analyse des fractions cellulaires est 

effectuee selon la technique du Western Blot. On utilise 
des fractions enrichies provenant des differents 
compartiments cellulaires : le compartiment cytoplasmique 
et le compartiment nucleoplasmique . L ' hybridation est 

20 realisee avec mAclC2 marque. 

Les ataxines 2 et 3 ainsi que la HDP mutante 
ont ete localisees dans la fraction cytoplasmique. La 
proteine de 130 kD liee a I'ADCA de type II a quant a 
elle ete localisee dans la fraction nucleoplasmique, Des 

25 tests de controle effectue avec, la TBP dont la 
localisation cellulaire est connue ont permis de valider 
ces resultats. 

Exemple 7 : clonage du gene implique dans 
30 I'ataxie cerebelleuse de type 2 (SCA2) . 



. Methode 

Ban<ques d' expression ADHc 

Des' ARN poly A+ SCA2 et SCA7 ont ete prepares a 
35 partir de lignees cellulaires lymphoblastoidiques (LCD 
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de patients SCA2 et SCA7 . La transcription inverse a ete 
realisee en utilisant des oligonucleotides hexameriques 
aleatoires. Les ADNc ont ete ligatures a des adaptateurs 
EcoRI et clones dans des bras de vecteur EcoRI I-SCREEN-1 
5 (Novagen®) et inseres en suivant le protocole du 
f abr icant . 

Criblage des banqpies d' expression en utilisant 
I'anticorps 1C2. 

10 Les phages ont ete incubes pendant 15 minutes 

pour infection avec les bacteries BL21 dans LB contenant 
du maltose. 0,2 mM, MgSO^ 10 mM et du chloramphenicol a 
40 mg/mi . Environ 8.10^ pfu de chaque banque ont ete 
deposees sur un milieu NZY . Lorsque les plaques furent 

15 visibles/ une membrane en nylon imbibee de IPTG lOmM a 
ete placee sur les boites et .1' induction de 1* expression 
a ete realisee pendant 3 heures 30 minutes. Les membranes 
ont ete ensuite lavees deux fois dans du PBS Ix, Tween 
0,05% pendant 5 et 30 minutes respectivement . 

20 Les membranes ont ete bloquees dans du lait 

ecreme a 5% puis incubees avec I'anticorps monoclonal 
1C2. L'anticorps secondaire ( immunoglobulines de chevre 
anti-souris) a ete couple a une peroxydase pour permettre 
une revelation avec le kit ECL (Amersham®) . Les temps 

25 d' exposition sont couramment de 20 minutes. 

Les plaques positives ont ete eluees a 4°C dans 
un milieu SM et les phages ont ete transformes dans les 
bacteries BL21 comme ci-dessus decrit. Un criblage 
secondaire et, si necessaire, tertiaire a ete realise 

30 comme ci-dessus. Les phages positifs isoles ont ete 
excises en suivant le protocole du fabricant (Novagen®) 
et les plasmides obtenus ont ete transformes dans des 
bacteries HBIOI. 

35 Analyses PGR et sequengage direct 
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Des RT-PCR ont ete realisees en utilisant les 
amorces suivantes : 

DANI: CGTGCGAGCCGGTGTATGGG (UH13); GGCQACGCTAGAAGGCCGCT (UHIO) 
5 DANI 5: CCACCATGCCCACCACCTCC: CCGCGCCGCCCAAGCTGTTG; 
DAN25: AA7GACGTGCTGCACCACTG; CCAGGCATCTGGATGGGAGG: 
AADIO: CCTCGGACCTGA77CAAGGC: GCTGCTGGGAGGCA7AAGGC: 
AAD14: AAG7GCCCCTGTCCATCCTC7; GGAGAGGAG7GCAACAGACC' 

10 

AAD20: CGG7CGCGGCAA7CC7AG; GAGGTTCCGGC7CGGAC7. 

Les amorces realisees pour DANI, DNA15, AAD14 
et ADD20 permettent 1 ' amplification de I'ADN genomique. 

15 Les produits ont ete analyses sur un gel 

d* agarose a 2% et transferes sur une membrane de nylon 
pour hybridation avec une sonde oligonucleotidique 
(CAG)16. Pour 1' analyse PGR des alleles SCA2, 100 ng 
d'ADN genomique ont ete amplifies dans 20 ml de Tris-HCl 

20 lOmM (pH 8,3), KCl 50 mM, MgCl. 1,5 mM, glycerol 15%, 250 
mM de chaque dNTP, et 10 pmoles d' amorces UHIO et UH13. 
Apres un demarrage a chaud de 5 minutes a SG^'C, 0,5 U de 
Taq polymerase a ete ajoutee, 35 cycles (30 secondes a 
94 °C, 30 secondes a SS^'C, 30 secondes a 72°C) et une 

25 elongation finale de 10 minutes a 72''C ont ete realises. 
Les produits ont ete deposes sur un gel denaturanf a 6% 
de polyacrylamide et 7 M d'uree. lis sont transferes et 
hybrides avec une sonde (CAG)7. Pour le sequengage direct 
des alleles SCA2, 40 cycles ont ete realises (les alleles 

30 "etendus" ont ete mieux amplifies en 1' absence de KCl et 
de glycerol) et les fragments excises ont ete sequences 
sur un sequenceur automatique Applied Biosystems® (ABI) 
avec des didesoxynucleotides f luorescents . 

35 Analyses des transferts Northern et Zoo 
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Un fragment d'ADNc EcoRI de 2,5 kb 
correspondant a i'extremite 3' du clone DAi^Tl a servi de 
sonde pour les analyses de transferts Northern et Zoo, 
Les transferts Northern de MTN humains et MTN II issus de 
5 cerveaux humains ont ete obtenus par Clontech®. 
L ' hybridation des sondes a ete realisee en utilisant la 
solution d' hybridation ExpressHyb® (Clontech®). Les 
transferts ont ete laves dans du SSC 0, Ix, SDS 0,1% a 
bS^'C. L ' hybridation des transferts Zoo a ete realisee 
10 dans du formamide a 30%. Le lavage a ete realise dans du 
SSC 0,5 X, SDS 0,1% a 51°C. 



. Resultats 

Clonage d' expression d'ADNc contenant des 
15 polygiutamines 

L ' utilisation selon 1' invention de I'anticorps 
monoclonal 1C2 avait permis precedemment de detecter dans 
des lignees lymphoblas tiques de patients presentant les 
..formes SCA2 et SCA7 de ADCA (ataxie cerebelleuse 

20 autosomale dominante) des proteines pathologiques devant 
contenir une longue chaine polyglutaminique . 

Pour essayer de doner les ADNc correspondants , 
deux banques d'ADNc lymphoblastiques ont ete construites 
dans un vecteur d' expression de bacteriophages I (I- 

25 Screen-1, Novagen®) , en utilisant des lignees 
cellulaires de patients SCA2 (AAD) ou SCAT (DAN) . Environ 
8.10" clones ont ete deposes sur plaques a partir de 
chaque banque et ont ete cribles avec I'anticorps 1C2. 

21 clones positifs ont ete obtenus apres trois 

30 iterations de criblage. 

En figure 1, est represente le criblage 
d' expression d'une banque d'ADNc en utilisant I'anticorps 
1C2 : la partie superieure gauche rectangulaire montre la 
detection du clone DANl a 1 ' etape primaire de criblage 

35 (environ 20 000 pfu par boite) , avec un arriere-plan tres 
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clair. Les autres ■ parties rectangulaires correspondent 
aux criblages secondaires de ce clone {environ 100 pfu 
par boite) . 

Tous/ excepte deux, contiennent des repetitions 
5 CAG teiles que determinees par hybridation avec une sonde 
oligonucleotidique (CAG) 10. 

Les 19 clones positifs a CAG correspondent a 8 
transcrits differents et sont presenres dans le tableau 
suivant. 
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Les 19 clones positifs incluent un ADNc 
d * huntingt ine normaie (20 gin) et un ADNc pour le 
facteur de transcription hSNF-a^~, qui contient aussi une 
repetition polyglutaminique (26 gin). La taille de la 
5 derniere proteine (174 kDa) I'exclut comme candidat pour 
les genes de SCA2 ou SCA7 . 

Les six autres transcrits correspondent a des 
genes contenant CAG nouveaux. 

Aucun des clones ne presente cependant un 

10 nombre de repetitions pathologique attendu ( > 35 gin) , 
les plus longues chalnes consistant en 14 CAG 
ininterrompus (AA-D14 et AAD20) . Dans tous les genes 
exceptes AAD20, le cadre de lecture ouvert permet de 
predire de maniere non ambigue une chaine 

15 polyglutaminique. En tenant compte des interruptions par 
les codons CAA, les plus longues chaines 
polyglutaminiques predites ont ete trouvees dans DANl (22 
gln) et DAN15 (18 gin) . Ce resultat est inattendu par 
rapport aux resultats obtenus au preaiable par transferts 

20 Western pour les que Is 1C2 ne detecte que les chalnes 
d'une longueur superieure a 30 gin dans des extraits 
cellul aires ent iers . 

Identification d'un clone SCA2 . 

25 Bien que les repetitions obtenues 

n ' apparaissent tres etendues, il restait possible qu'un 
des clones represente un allele normal au locus SCA2 ou 
SCA7, ou bien la retractation d'un allele etendu du fait 
de 1 ' instabilite des longues repetitions dans les 

30 bacteries. 

Des amorces adjacentes aux repetitions (voir 
methode) ont done ete construites et testees par RT-PCR 
ou PGR . sur, respect ivement, de I'ARNm ou de I'ADN 
genomique pbfcenus de patients SCA2 et SCA7 . 
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Une paire d' amorces (derivees.de DANl) detecte 
les fragments RT-PCR etendus des patients SCA2 . Cela a 
ete confirme en utilisant les memes sondes dans toutes 
les families SCA2 testees au niveau de I'ADN genomique . 
5 En figure 2 est representee la detection par 

PGR d' alleles etendus dans une famille SCA2 : 1' analyse 
PGR a ete realisee en utilisant les sondes UHIO et UH13; 
les tallies alleliques (nombre de ^repetitions) sont 
22/37, 23/38, 22/43, 22/43, 22/23 et 22/22 pour les 

10 individus 1 a 6 respectivement ; le pere dans la 
generation II a transmis des alleles etendus par 5 
repetitions a ces deux filles affectees; ceci est correle 
avec une forte anticipation ( 1 * age de declenchement de la 
maladie est indique sur le pedigree); on note une 

15 heterogeneite apparente des alleles mutants; la plus 
forte bande a ete utilisee pour la determination des 
tallies de repetitions. 

De plus, ces amorces amplifient le fragment 
correspondant dans quatre YAC de la region candidate ,SGA2 

20 de 12q23-24,l (CEPH YAC 674f2, 722h7, 774a3 et 910gl) qui 
contiennent egalement le microsatellite D12S1340 
(AFM291xe9) . 



Alleles normaux et pathologiques 

25 La repetition originelle dans le clone DANl est 

interrompue par deux triplets GAA. Afin de verifier si 
les interruptions sont trouvees dans les alleles normaux 
de maniere generale, les produits PGR correspondants a 17 
alleles normaux independanrs ont ete sequences. 

30 Tous les alleles . analyses contiennent de 1 a 3 

GAA disperses, dans les plus communs des cas (9 sur 17) 
deux GAA sont observes avec une structure (GAG) 8 GAA 
(GAG) 4 GAA (GAG) 8, comme pour DANl. 

En figure 3, est representee la structure 

35 d' alleles normaux et pathologiques: le sequenqage direct 
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des produits PGR montre des codons CAA intercalaires 
(cercies plains) parmi des repetitions CAG (cercles 
vides) ; deux alleles pathologiques a 40 et 41 repetitions 
et un allele a 34 repetitions d'un porteur cliniquement 
5 normal d*un haplotype SCA2 ont ete amplifies dans 
differentes conditions et ne montrent pas de CAA 
intercalaires. 

Par analyse PGR de 110 alleles, un nombre 
normal de 17 a 29 repetitions a ete observe. 22 

10 repetitions ont ete observees pour 75% des alleles alors 
que le nombre lie a la pathogenici te etait de 37 a 50 
repetitions (n=31) . 

En figure 4, est representee la distribution 
des tallies alleliques au locus SCA2 : les analyses PGR 

15 d'individus frangais normaux et SCA2 ont ete realisees 
comme decrit ci-dessus; les 110 alleles normaux sont des 
alleles independants alors que les 31 alleles 
pathologiques (barres pleines) derivent de 8 families. 

Deux alleles mutants independants ont ete 

20 sequences et se presentent comme constitues de pures 
chaines CAG (voir figure 3), tout comme s'est presente un 
allele a 34 CAG d'un individu age de 32 ans cliniquement 
normal issu d'une famille SCA2 , Get individu est porteur 
de 1' haplotype pathologique . 

25 

Instabilite et age de declenchement de la 

maladie 

Dans les 16 cas de transmissions de parents a 
enfants que nous avons pu etudier, 13 ont mis en evidence 

30 une instabilite. Un seul cas a mis en evidence une 
diminution (de 3 unites), et de maniere plus frappante, 5 
cas ont mis en evidence une augmentation de- 5 a 10 
repetitions. Voir, a ce sujet, la figure 2' et voir 
egalement la' figure 5 qui represente 1 ' instabilite de la 

35 repetition SGA2 lors d'une transmission" de parents a 
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enfants: la difference entre ie nombre d' unites de 
repetitions dans les alleles etendus de parents at 
enfants a ete determinee pour neuf transmissions 
paternelles et sept transmissions maternelles chez 8 
5 families. 

Ces grands sauts ont ete observes pour les 
transmissions a la fois paternelles et maternelles, 
contrairement a ce qui a ete observe dans les autres 
maladies iiees aux chaines polygluraminiques - 

10 Une forte correlation inverse entre 1 ' age de 

declenchement de la maladie et la longueur des 
repetitions a ete observee pour 26 patients (r = -0,86 
avec une regression quadratique, p = 0,0001). 

En figure 6, est representee la correlation 

15 entre I'age de declenchement de la maladie clinique et le 
nombre de repetition: les donnees proviennent de 2 6 
patients (age moyen de declenchement de la maladie = 34 
ans, gamme allant de 13 a 60 ans) ; le coefficient . de 
correlation est calcule pour une regression quadratique 

20 (r = -0,86;- p < 0, 0001) . 

L'effet de repetitions addi tionnelles est: 
frappant: pour quatre patients presentant 37 repetitions^ 
1 ' age de declenchement de la maladie s*est situe entre 45 
et 60 ans alors que pour les trois patients presentant de 

25 46 a 50 repetitions, 1 ' age de declenchement de la maladie 
s'est situe entre 13 et 18 ans. 

Le gene SCA2 et. son expression 

Le clone DANl (4,0kb) a ete entierement 
30 sequence: en figure 1, est representee la SEQ ID n*'7. 

La figure 7 represente en effet la sequence de 
I'ADNc SCA2 . La sequence nucleotidique de la position 1 a 
3986 proyient du clone DANl. Les dernieres 177 paires de 
bases (en italique) proviennent de EST {H92640., N90240 et 
35 Z13574 de dbEST) qui chevauchent, de maniere non ambigue, 
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I'extremite 3' de la sequence DANl , Seules les sequences 
communes aux trois EST ont ete ici ajoutees a la sequence 
DANl . La chaine polyA interne a la position 4002 differe 
en longueur des trois EST (indiques par un a en lettre 
5 minuscule) et n'est pas precedee par un signal de 
polyadenylation. EST N90240 presente cependant deux 
signaux de polyadenylation putatifs AATAAA. situes a 33 et 
59 paires de bases en 3 ' de 1 ' ex-eremite de la sequence 
consensus proposee. Le premier codon methionine a la 

10 position 243 et le consensus Kozak qui le precede sont 
soulignes. Ce codon est en phase avec une sequence 
d ' aminoacides putative situee en amont (en italique) . Le 
premier codon de terminaison dans le cadre (position 
2745) est souligne. Le cadre de lecture ouvert 

15 chevauchant est egalement montre (en italique) et son 
codon de terminaison souligne (position 3638) . La 
sequence de la position 2560 a la position 2880 est 
confirmee par des EST chevauchant (H70616^ R00491, 
R10603), ce qui ecarte une mutation artef actuelle du 

20 cadre de lecture dans le clone DANl . 

Un cadre de lecture ouvert commence a la 
position 1 jusqu'a la position 2745. La premiere 
methionine est a la position 243 et est precedee d'une 
tres bonne sequence consensus pour 1' initiation de la 

25 traduction (accord de 6/9 y compris 1 ' important A a -3). 
La sequence amont est tres riche en GC, ce qui ' pourrait 
expliquer 1 ' absence de codons d' arret dans les trois 
cadres de lecture, 

De maniere inattendue, un second cadre de 

30 lecture ouvert de 348 codons chevauche, dans un cadre 
different, le plus grand cadre de lecture ouvert. La 
probabilite pour que cela soit le resultat du hasard est 
faible; cela suggere une mutation du cadre de lecture 
dans le clone originel .DANl, Une comparaison avec la 

35 sequence de 3 EST chevauchant cette region ■ (positions 
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2560 a 2880) a cependant confirme la sequence du clone 
DANl et la presence du codon d' arret predit. L' existence 
d'un dephasage du cadre de lecture lors de la traduction 
reste une possibilite distincte, d'autant plus que le 
5 programme informatique GRAIL la donne au cadre de lecture 
ouvert 3' un score "excellent" pour sa capacite a coder 
des proteines. Une autre .possibilite est 1' existence 
d'epissages alternatifs produisant diverses formes 
d'ARNm, certaines etant porteuses d'un decalage du cadre 
10 de lecture (exemple: le gene FMRl fragile X mental 
retardation 1) . Trcis autres EST chevauchant etendent la 
region 3' non traduite de 177 paires de bases (voir 
figure 7 } . 

Un fragment DANl de 2,5 kb a ete utilise comme 
15 sonde dans des transferts Northern avec de I'ARN polyA + 
humain. Une expression ubiquiste a ete trouvee dans 
differentes regions du cerveau et une forte expression a 
ete observee dans d' autres organes. 

En figure 8, est. represente une analyse d*un 
20 transfert Northern. Une sonde de 2,5 kb (de la position 
1370 a. 3985 sur la figure 7) a ete utilisee pour les 
transferts Northern (MTN Clontech® et MTN2 issu de 
cerveau) contenant de I'ARN polyA + humain des regions de 
cerveau- et des tissus indiques. La longueur de I'ARNm a 
25 ete evaiuee a 4,4 kb, ce qui est tres proche de la 
sequence de 4,2 kb derivee du DANl et chevauchant les 
EST. 

La ou les proteine(s) predite(s) a partir des 
deux cadres de lecture ouverts ne presente(nt) pas 

30 d'homologie significative avec des proteines connues chez 
les humains ou chez les autres organismes, Le gene 
apparalt bien conserve chez les mammiferes (bovins, 
lapins, moutons, cochons et souris) et les poulets comme 
I'indiquent* les fragments a fortes reactions- croisees 

35 observes sur transfert Zoo en utilisant les memes sonde 



wo 97/17445 38 PCT/FR96/01773 



d'ADNc et conditions d ' hybridation et de lavage que pour 
1 'analyse par transfert Northern. 



5 . Discussion 

SCA2 est le sixieme locus clone correspondant a 
une maladie ou se trouve impliquee une extension de 
repetitions CAG/polyglutamine . 

10 Dans la population etudiee, une limite 

inferieure de pathogenicite de 37 glutamines a ete 
trouvee, ce qui est tres proche de la limite de 36 
trouvee chez les tres rares patients atteints de la 
maladie de Huntington. Cette limite n'est pas definitive 

15 et ne pourra etre etablie que par 1' etude d'un nombre 
plus eleve de patients. Les limites inferieures pour les 
autres maladies sont respect ivement 40, 40, 49 et 61 pour 
SBMA, SCAl, DRPLA et MJD/SCA3. 

Malgre un seuil de pathogenicite similaire, 

20 I'effet des glutamines additionnelles apparait plus 
important dans SCA2 que dans HD puisque le declenchement 
juvenile de la maladie (inferieur ou egal a 20 ans ) est 
atteint avec 46 repetitions pour SCA2 alors que, pour HD, 
les cas juveniles sont ma j or itairement atteints avec plus 

25 de 60 repetitions et, pour SCAl, a plus de 55 
repetitions. 

La courbe, tres abrupte, de correlation semble 
plus proche de celle de la maladie de Machado- Joseph 
(SCA3) , pour laquelle le seuil de pathogenicite est 
30 cependant plus eleve. Cela suggere que la proteine 
impliquee dans SCA2 (ataxine 2) est tres sensible aux 
polyglutamines . 

En alternative, cette sensibilite accrue 
pourrait etre une propriete des neurones affectes. 
35 L ' existence d' un effet "contexte proteique" est supporte 
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par le fait que dans la proteine TBP (TATA binding 
protein), jusqu^a 42 glutainines sont trouvees dans les 
alleles normaux, II est de plus possible que la toxicite 
d*une ataxine troncaturee soit plus elevee que celle de 
5 la proteine entiere, avec un role protecteur de la partie 
proteique troncaturee. 

Un autre caractere tres frappant chez les 
families SCA2 est la haute instabilite de la repetition. 
13 des 16 transmissions mettent en evidence une 

10 instabilite et 5 d'entre elles, ^ en particulier, 
presentent une augmentation de 5 a 10 repetitions, 

De telles augmentations se produisent dans 20 a 
30% . des transmissions paternelles de HD^ 

preferentiellement chez des alleles parentaux a plus de 

15 45 glutamines, et sont tres rares, pour SCAl ou SBMA, 
pour des tallies de repetitions similaires. 

Ces grandes extensions addi tionnelles se 
produisent, de plus, iors de transmissions paternelles et 
maternelles. Ce fait est en bonne correlation avec le 

20 manque de biaxs parental dans 1 ' ant icipation de SCA2 pour 
laquelle les memes 11-16 annees d ' anticipation de 1 ' age 
de declenchement de la maladie ont ete observees 
independamment du sexe du parent transmetteur . 

Le biais paternel pour 1' extension qui est 

25 observee chez HD, SCAl, DRPLA et aussi chez des 
dystrophies myotoniques (pour des alleles dans la gamme 
des 50-100 CTG) , et, dans une moindre mesure chez SBMA, 
n'est pas une propriete intrinseque des repetitions CAG 
ou CTG. Des ef fets dus a la position (nature des 

30 sequences environnantes et localisation de la sequence 
relativement aux origines de replication) pourraient 
jouer un role important dans 1 ' instabilite . 

Un autre trait du locus SCA2 est 
1 ' interruption, chez les alleles normaux, de la 
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repetition de CAG par 1 a 3 CAP^ (qui codenr egalement 
pour des glut amines) . 

Les trois alleles pathologiques sequences 
(issus de families differentes) contiennent cependant des 
5 repetitions purement CAG. Ceci est tres similaire au cas 
de SCAl pour lequel les alleles normaux sont interrompus 
par des codons CAT (histidine) alors que les alleles 
etendus sont constitues purement de CAG. 

Ces interruptions dans les repetitions 
10 pourraienr avoir un effet stabilisant et la perte des 
interruptions CAA pourrait constituer un evenement 
initial dans I'histoire de la mutation. 

Comme dans quatre des cinq autres maladies a 
polyglutamine (1 'exception etant SBMA et le gene du 
15 recepteur androgene) , le gene SCA2 n'a pas de fonction 
evidente et apparait comme s'exprimant de maniere 
ubiquiste dans le cerveau et cela meme dans des zones 
telles que le putamen qui reste non affecte chez les 
patients, 

20 La taille apparenne de la proteine SCA2 mutante 

est de 150 JcDa sur transferts Western mais les chaines 
etendues de polygiutamines peuvent affecter la migration 
electrophorecique et une taille d'environ 120-130 kDa 
(environ 1100-1200 acides amines) pour 1 ' ataxine 2 

25 normale peut etre estimee. 

Le cadre de lecture ouvert principal commengant 
au premier codon methionine (caracterise par une tres 
bonne concordance avec le consensus Kozak) , code pour une 
proteine de 834 acides amines et d'un poids moleculaire 

30 de 8 9,9 kDa. 

Pour expliquer un tel ecart, on peut supposer 
que, soit le vrai codon d* initiation est en amont de la 
sequence presentee, soit le cadre de lecture ouvert 3' 
qui chevauche le cadre principal est utilise par 

35 dephasage du cadre de lecture lors de la traduction sur 
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les ribosomes. Une troisieme possibilite est que les ADN 
sequences correspondent a un epissage alternatif alterant 
la phrase de lecture. Etant donne que la sequence 
presentee (4,2 kb) est tres proche de la longueur d'ARNm 
5 estimee sur transfert Northern [4,4 kb, polyA inclus), il 
n'y a pas beaucoup de place pour un site d' initiation 
amont additionnel . 

II est done possible qu'un dephasage 
ribosoiaique du cadre de lecture, qui est observe pour 

10 plusieurs genes viraux et aussi pour quelques genes 
humains/ soit implique. 

Une mutation -1 du cadre - de lecture 
correspondrai t a une proteine normale de 1132 acides 
amines et de poids moleculaire 121,7 kDa, ce qui est en 

15 tres bon accord avec le poids moleculaire estime. 

Par analyse informatique de la sequence ARNm, 
des structures secondaires de pseudonoeuds , qui peuvenr 
constituer des sequences stimulant les evenements de 
mutation du cadre de lecture, n'ont pu etre mises en 

20 evidence. La mutation -1 du cadre de lecture telle que 
suggeree ci-dessus ne constitue done qu ' une explication 
possible des ecarts de tallies observes. 

La mise en evidence d'un eventuel epissage 
alternatif pourra etre etablie par RT-PCR en utilisant 

25 des amorces basees sur la sequence de la figure 7 a 
partir d'ARN provenant de divers tissus. 
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LISTE DE SEQUENCES 



( 1 ) INFORMATIONS GENERALES : 
(i) DEPOSANT: 

(A) NOM: C,N.R,S. 

(B) RUE: 3, rue Michel-Ange 

(C) VILLE: PARIS 

( E ) PAYS : FRANCE 

(F) CODE POSTAL: 75016 

(A) NOM: I.N.S.E.R.M. 

(B) RUE: 101, rue de Tolbiac 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75013 



(ii) TITRE DE L' INVENTION: Moyens pour le traitement et 
le diagnostic des maladies neurodegeneratives 

(iii) NOMBRE DE SEQUENCES: 6 

(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentin Release #1.0, Version #1.30 
( OEB) 



(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 399 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: des deux 

(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 

(iv) ANTI-SENS: NON 
(vii) SOURCE IMMEDIATE: 
(B) CLONE: AADIO 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID 



CAGCAGCAGC 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNCAGC 
AA 



AGCAGCAGCA 
NNNNNNNCAG 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
AGCAGCAGCA 



ACAGCAGCAG 
CAGCAACAGC 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
GCAACAACAG 



CAGNNNNNNN 
AGCAGNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
NNNNNNNNNN 
CACCAACAGC 



NO: 1 : 
40 
80 
120 
160 
200 
240 
280 
320 
360 
400 
402 
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(3) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 152 paires de bases 

( B ) TYPE : nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: des deux 

(ii) TYPE DE MOLECULE: ADNc 
( i i i ) HYPOTHET I QUE : NON 
(iv) ANTI-SENS: NON 



(vii) SOURCE IMMEDIATE: 
(B) CLONE: AAD14 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID 

CAGCAGCAGC AGCAGCAGCA GCAACAGCAG CAGCAGNNNN 

NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN 

NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NCAGCAGCAG 

CAGCAGCAGC AGCAGCAGCA GCAGCAGCAG CAG 



(4) INFORMATIONS POUR LA SEQ ID NO : 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 66 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: des deux 

(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 

(vii) SOURCE IMMEDIATE: 
(B) CLONE: DANl 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID 

CAGCAGCAGC AGCAGCAGCA GCAGCAACAG CAGCAGCAGC 
AACAGCAGCA GCAGCAGCAG CAGCAG 



(5) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 54 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: des deux 
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(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 

(iv) ANTI-SENS: NON 
(vii) SOURCE IMMEDIATE: 
(B) CLONE: DAN15 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

CAGCAGCAGC AGCAGCAGCA GCAACAGCAG CAGCAGCAGC 40 
AGCAGCAACA GCAA 54 

(6) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 36 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: des deux 

(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 

( vii ) SOURCE IMMED I ATE : 
(B) CLONE: DAN26 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

CAGCAGCAGC AGCAGCAGCA ACAGCAGCAG CAGCAG 36 

(7) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 42 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: des deux 

(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 



(vii) SOURCE IMMEDIATE: 
( B ) CLONE : AAD20 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
CAGCAGCAGC AGCAGCAGCA GCAGCAGCAG CAGCAGCAGC AG 42 
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(8) INFORMATIONS POUR LA S£Q ID NO: 7: 

(1) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 4199 paires de bases 
<B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: des deux 

(li) TYPE DE MOLECULE: ADNc 
(ii2.} HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 

(vii) SOURCE IMMEDIATE: 

(B) CLONE: DANl 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

ACGGCAACGG CGGCGGCGCG TTTCGGCCCG GCTCCCGGCG GCTCCTTGGT CTCGGCGGGC 60 

CTCCCCGCCC CTTCGTCGTC GTCCTTCTCC CCCTCGCCAG CCCGGGCGCC CCTCCGGCCG 120 

CGCCAACCCG CGCCTCCCCG CTCGGCGCCC GTGCGTCCCC .GCCGCGTTCC GGCGTCTCCT 180 

TGGCGCGCCC GGCTCCCGGC TGTCCCCGCC CGGCGTGCGA GCCGGTGTAT GGGCCCCTCA 24 0 

CCATGTCGCT GAAGCCCCAG CAGCAGCAGC AGCAGCAGCA GCAACAGCAG CAGCAGCAAC 300 

AGCAGCAGCA GCAGCAGCAG CAGCCGCCGC CCGCGGCTGC CAATGTCCGC AAGCCCGGCG 360 

GCAGCGGCCT TCTAGCGTCG CCCGCCGCCG CGCCTTCGCC GTCCTCGTCC TCGGTCTCCT 420 

CGTCCTCGGC CACGGCTCCC TCCTCGGTGG TCGCGGCGAC CTCCGGCGGC GGGAGGCCCG 480 

GCCTGGGCAG AGGTCGAAAC AGTAACAAAG GACTGCCTCA GTCTACGATT TCTTTTGATG 540 

GAATCTATGC AAATATGAGG ATGGTTCATA TACTTACATC AGTTGTTGGC TCCAAATGTG 600 

AAGTACAAGT GAAAAATGGA GGTATATATG AAGGAGTTTT TAAAACTTAC AGTCCGAAGT 660 

GTGATTTGGT ACTTGATGCC GCACATGAGA AAAGTACAGA ATCCAGTTCG GGGCCGAAAC 720 

GTGAAGAAAT AATGGAGAGT ATTTTGTTCA AATGTTCAGA CTTTGTTGTG GTACAGTTTA 780 

AAGATATGGA CTCCAGTTAT GCAAAAAGAG ATGCTTTTAC TGACTCTGCT ATCAGTGCTA 8 40 

AAGTGAATGG CGAACACAAA GAGAAGGACC TGGAGCCCTG GGATGCAGGT GAACTCACAG 900 

CCAATGAGGA ACTTGAGGCT TTGGAAAATG ACGTATCTAA TGGATGGGAT CCCAATGATA 960 

TGTTTCGATA TAATGAAGAA AATTATGGTG TAGTGTCTAC GTATGATAGC AGTTTATCTT 1020 

CGTATACAGT GCCCTTAGAA AGAGATAACT CAGAAGAATT TTTAAAACGG GAAGCAAGGG 1080 

CAAACCAGTT AGCAGAAGAA ATTGAGTCAA GTGCCCAGTA CAAAGCTCGA GTGGCCCTGG 1140 

AAAATGATGA TAGGAGTGAG GAAGAAAAAT ACACAGCAGT TCAGAGAAAT TCCAGTGAAC 1200 

GTGAGGGGCA CAGCATAAAC ACTAGGGAAA ATAAATATAT TCCTCCTGGA CAAAGAAATA 12 60 
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GAGAAGTCAT ATCCTGGGGA AGTGGGAGAC AGAATTCACC GCGTATGGGC CAGCCTGGAT 1320 

CGGGCTCCAT GCCATCAAGA TCCACTTCTC ACACTTCAGA TTTCAACCCG AATTCTGGTT 13 80 

CAGACCAAAG AGTAGTTAAT GGAGGTGTTC CCTGGCCATC GCCTTGCCCA TCTCCTTCCT 14 4 0 

CTCGCCCACC TTCTCGCTAC CAGTCAGGTC CCAACTCTCT TCCACCTCGG GCAGCCACCC 1500 

CTACACGGCC GCCCTCCAGG CCCCCCTCGC GGCCATCCAG ACCCCCGTCT CACCCCTCTG 15 60 

CTCATGGTTC TCCAGCTCCT GTCTCTACTA TGCCTAAACG CATGTCTTCA GAAGGGCCTC 1620 

CAAGGATGTC CCCAAAGGCC CAGCGACATC CTCGAAATCA CAGAGTTTCT GCTGGGAGGG 1680 

GTTCCATATC CAGTGGCCTA GAATTTGTAT CCCACAACCC ACCCAGTGAA GCAGCTACTC 174 0 

CTCCAGTAGC AAGGACCAGT CCCTCGGGGG GAACGTGGTC ATCAGTGGTC AGTGGGGTTC 18 00 

CAAGATTATC CCCTAAAACT CATAGACCCA GGTCTCCCAG ACAGAACAGT ATTGGAAATA 18 60 

CCCCCAGTGG GCCAGTTCTT GCTTCTCCCC AAGCTGGTAT TATTCCAACT GAAGCTGTTG 1920 

CCATGCCTAT TCCAGCTGCA TCTCCTACGC CTGCTAGTCC TGCATCGAAC AGAGCTGTTA 1980 

CCCCTTCTAG TGAGGCTAAA GATTCCAGGC TTCAAGATCA GAGGCAGAAC TCTCCTGCAG 204 0 

GGAATAAAGA AAATATTAAA CCCAATGAAA CATCACCTAG CTTCTCAAAA GCTGAAAACA 2100 

AAGGTATATC ACCAGTTGTT TCTGAACATA GAAAA.CAGAT TGATGATTTA AAGAAATTTA 2160 

AGAATGATTT TAGGTTACAG CCAAGTTCTA CTTCTGAATC TATGGATCAA CTACTAAA.CA 2220 

AAAATAGAGA GGGAGAAAAA TCAAGAGATT TGATCAAAGA. CAAAATTGAA CCAAGTGCTA 22 80 

AGGATTCTTT CATTGAAAAT AGCAGCAGCA ACTGTACCAG TGGCAGCAGC AAGCCGAATA 234 0 

GCCCCAGCAT TTCCCCTTCA ATACTTAGTA ACACGGAGCA CAAGAGGGGA CCTGAGGTCA 24 00 

CTTCCCAAGG GGTTCAGACT TCCAGCCCAG CATGTAAPlCA AGAGAAAGAC GATAAGGAAG 2 4 60 

AGAAGAAAGA CGCAGCTGAG CAAGTTAGGA AATCAACATT GAATCCCAAT GCAAAGGAGT 252 0 

TCAACCCACG TTCCTTCTCT CAGCCAAAGC CTTCTACTAC CCCAACTTCA CCTCGGCCTC 2580 

AAGCACAACC TAGCCCATCT ATGGTGGGTC ATCAACAGCC AACTCCAGTT TATACTCAGC 2 64 0 

CTGT7TGTTT TGCACCAAAT ATGATGTATC CAGTCCCAGT GAGCCCAGGC GTGCAATACC 2700 

AAATATGCCC CAACAGCGGC AAGACCAGCA TCATCAGAGT GCCATGATGC ACCCAGCGTC 27 60 

AGCAGCGGGC CCACCGATTG CAGCCACCCC ACCAGCTTAC TCCACGCAAT ATGTTGCCTA 282 0 

CAGTCCTCAG CAGTTCCCAA ATCAGCCCCT TGTTCAGCAT GTGCCACATT ATCAGTCTCA 2880 

GCATCCTCAT GTCTATAGTC CTGTAATACA GGGTAATGCT AGAATGATGG CACCACCAAC 2940 

ACACGCCCAG CCTGGTTTAG TATCTTCTTC AGCAACTCAG TACGGGGCTC ATGAGCAGAC 3000 

GCATGCGATG TATGCATGTC CCAAATTACC ATACAACAAG GAGACAAGCC CTTCTTTCTA 3060 

CTTTGCCATT TCCACGGGCT CCCTTGCTCA GCAGTATGCG CACCCTAACG CTACCCTGCA 3120 

CCCACATACT CCACACCCTC AGCCTTCAGC TACCCCCACT GGACAGCAGC AAAGCCAACA 3180 
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TGGTGGAAGT CATCCTGCAC CCAGTCCTGT TCAGCACCAT CAGCACCAGG CCGCCCAGGC 3240 

TCTCCATCTG GCCAGTCCAC AGCAGCAGTC AGCCATTTAC CACGCGGGGC TTGCGCCAAC 3300 

TCCACCCTCC ATGACACCTG CCTCCAACAC GCAGTCGCCA CAGAATAGTT TCCCAGCAGC 3360 

ACAACAGACT GTCTTTACGA TCCATCCTTC TCACGTTCAG CCGGCGTATA CCAACCCACC 3420 

CCACATGGCC CACGTACCTC AGGCTCATGT ACAGTCAGGA ATGGTTCCTT CTCATCCAAC 34 80 

TGCCCATGCG CCAATGATGC TAATGACGAC ACAGCCACCC GGCGGTCCCC AGGCCGCCCT 354 0 

CGCTCAAAGTG CACTACAGCC CATTCCAGTC TCGACAACAG CGCATTTCCC CTATATGACG 3 600 

CACCCTTCAG TACAAGCCCA CCACCAACAG CAGTTGTAAG GCTGCCCTGG AGGAACCGAA 3660 

AGGCCAAATT CCCTCCTCCC TTCTACTGCT TCTACCAACT GGAAGCACAG AAAACTAGAA 3720 

TTTCATTTAT TTTGTTTTTA AAATATATAT GTTGATTTCT TGTAACATCC AATAGGAATG 378 0 

CTAACAGTTC ACTTGCAG7G GAAGATACTT GGACCGAGTA GAGGCATTTA GGAACTTGGG. 38 4 0 

GGCTATTCCA TAATTCCATA TGCTGTTTCA GAGTCCCGCA GGTACCCCAG CTCTGCTTGC 3900 

CGAAACTGGA AGTTATTTAT TTTTTAATAA CCCTTGAAAG TCATGAACAC ATCAGCTAGC 3960 

AAAAGAAGTA ACAAGAGTGA TTCTTGCTGC TATTACTGCT AAAAAAAAAA AAAAAAAAAA 4 020 

AaaaaaaaTC AAGACTTGGA ACGCCCTTTT ACTAAACTTG ACAAAGTTTC AGTAAATTCT 408 0 

TACCGTCAAA CTGACGGATT ATTATTTATA AATCAAGTTT GATGAGGTGA TCACTGTCTA 414 0 

CAGTGGTTCA ACTTTTAAGT TAAGGGAAAA ACTTTTACTT TGTAGATAAT ATAAAATCC 4199 
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REVENDICATIONS 

1. Utilisation de I'anticorps 1C2 ou d'un 
fragment ou d'un derive de I'anticorps 1C2 pour la 

5 preparation d*une composition pharmaceutique destinee au 
traitement preventif ou curatif des maladies 
neurodegeneratives associees a une repetition de 
giutamine . 

2. Utilisation selon la revendication 1 
10 caracterisee en ce qu'elle met en oeuvre I'anticorps iC2. 

3. Utilisation selon la revendication 1 
caracterisee en ce qu'elle met en oeuvre un fragment ScFv 
de I'anticorps 1C2. 

4. Utilisation d'un acide nucleique codant pour 
15 un fragment ScFv de I'anticorps 1C2 pour la preparation 

d'une composition pharmaceutique destinee au traitement 
preventif ou curatif des maladies neurodegeneratives 
associees a une repetition de giutamine. 

5. Utilisation selon 1 * une quelconque des 
20 revendications 1 a 4 pour le ' traitement des maladias 

teiles que par exemple la maladie de Huntington, I'ataxie 
spinocerebelleuse de type 1, 2, 3, 4, 5 ou 7, 1 'atropine 
musculaire spino-bulbaire associee au chromosome X ou 
maladie de Kennedy, I'atrophie dentarorubral- 

25 pallidoluysienne, I'ataxie. spinocerebelleuse- autosomale 
dominante, et la paraplegie spastique familiaie, ou 
encore la maladie affective bipolaire, la psychose 
maniaco-depressive ou la schizophrenic . 

6. Molecule comprenant le site de liaison de la 
30 region variable de la chaine legere de I'anticorps 1C2 

relie par un bras peptidique au site de liaison de la 
region variable de la chaine lourde ce I'anticorps 1C2 . 

7. Sequence d' acide nucleique caracterisee en 
ce qu'elle code pour la molecule selon la revendication 

35 6. 
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S.Vecteur comprenant ia sequence seion la 
revendication 7 sous controle d'un promoteur fonctionnel 
dans les cellules de maimuif eres . 

9. Vecteur selon la revendication 8 caracterise 
5 en ce qu*il s*agit d'un adenovirus recombinant: defectif. 

10. Vecteur selon la revendication 8 
caracterise en ce qu'il s'agit d'un retrovirus 
recombinant defectif. 

11. Vecteur selon ia revendication 8 
10 caracterise en ce qu'il s'agit d'un virus adeno associe 

recombinant defectif . 

12. Vecteur selon la revendication 8 
caracterise en ce qu'il s'agit du virus de 1' herpes 
recombinant defectif. 

15 13. Composition pharmaceutique comprenant 

I'anticorps 1C2, un fragment ou derive de cet anticorps , 

14. Composition pharmaceutique comprenant un 
vecteur selon- I'une quelconque des revendications 8 a 12. 

15. Composition pharmaceutique destinee au 
20 traitement des maladies neurodegeneratives associees a la 

presence d'une proteine portant une chaine homopolymere 
de glutamme caracterisee en ce qu'elle comprend 
I'anticorps 1C2, un fragment ou derive de cet anticorps, 
notamment selon ia revendication 6, ou un vecteur selon 
25 I'une quelconque des revendications 8 a 12. 

16. Methode de diagnostic des maladies 
neurodegeneratives caracterisee en ce que 1 ' on detecte in 
vitro, au mo yen de I'anticorps 1C2, a un fragment ou 
d'un derive de I'anticorps 1C2 la presence de proteines 

30 portant une chaine polyglutamine de longueur 
pathologique . 

17. Methode selon revendication 16 caracterisee 
- en ce que la detection de ces proteines est realisee par 

mise en contact d'un extrait cellulaire avec I'anticorps 
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monoclonal 1C2 ez revelation des complexes anticorps- 
antigenes formes. 

13. Hethode selon 1 * une des revendications 16 
ou 17 caracterisee en ce que la detection est realisee 
5 sur un extrait de cellules sanguines. 

19. Methode selon 1 ' une quelconque des 
revendications 15 a 18 pour la mise en evidence de 
predisposition a la maladie de Huntington ou a une ataxie 
spinocerebelleule 1/ 2 ou 3 . 

10 20, Methode selon 1 ' une quelconque des 

revendications precedentes 16 a 18 pour la mise en 
evidence de maladies degeneratives du systeme nerveux 
central causees par la presence d'une chaine 
polyglutamine dans une proteine exprimee. 

15 21. ADN caracterise en ce qu'il comporte tout 

ou partie d'au moins une des sequences SEQ ID n"*!, n''2/ 
n'^3, n*'4, n*^5, n*^6, n**7 ou d'au moins une sequence 
presentant une homologie superieure ou egale a 50% avec 
ces sequences. 

20 22. Les ARN correspondant a la transcription 

d'au moins un ADN selon la revendication 21, les 
sequences complementaires de ces ADN ou ARN, ou leurs 
sequences anti-sens . 

23. Procede de criblage d' expression d'ADNs a 
25 repetition CAG ou de leurs produits d' expression 

caracterise en ce qu'il comprend 1 ' utilisation de 
I'anticorps 1C2 ou d'un fragment ou d'un derive de cet 
anticorps. 

24. Procede d* identification ou de purification 
30 de proteines a chaines polyglutaminiques utilisant une 

etape d/ immunodetection ou ■ d Vimmunopurif ication par 
I'anticorps 1C2, fragment ou derive de . cet anticorps, ou 
pouvant conduire secondairement a identifier le gene 
correspondant . 
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25. Methode de diagnostic utiiisant 
1 • amplification PGR sur ADN ou RT-PCR sur ARN perinettant 
de detecter des formes mutees dans des genes codant pour 
des chaines poiyglutaminiques identifiees ou donees 
5 grace a I'anticorps 1C2. 
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Nombre de repetri^ions de CAG 
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figure 7 

* ACGGCAACGGCCGCGGC3CG . . . CGGCCCGGC*TCCCGO\_Cwv.. . CC "'^I'l^CCC - C-^^j^Cnjwv- — . GC wC*j%_ GCG 1 GG 
G ;V G C G A - H P G 5 H 1 - G G G P = ? ' 7 

7 TCGTCGTCCTTCTCCCCrrCGGCAGCGCGGGCGCCCCTCrGGCCGCGCCVACGCGCGCGTCCCCGCTCGGCGCCC 1 5 C 
VVLL?:,ASPGAP?AA?rRASPLCAR 

IS : GTGCGTCCGCGGCGGGTTCCGGCGTCTCGTTGGCGCGCCGGGCTCrGGCCTCrCGCCGGCGGCCGTGCGAGCCGG 1^5 
A 5 P P J G ■/ J - A P -A P G G P P .A G r P V 

22 6 TGTATGGGGGGGT GACCJ^.T'GT CGGTGAAGGCCCAGCAGGAGCAGGAGGAGGAGGAGC.VACAGCAGCAGGAGCAAC 2 C 0 
i'GPLrMSLKPQQQQQQQQQQQQQQO 



301 AGCAGCAGCAGGAGCAGCAGCAGGCGGCGCCCGCGGCTCCGAATGTCCGCAAGCCCGGCGGCAGCGGCCrrCTAC 3 7 5 
QQOQC OQPP PAAANVRKPGG SGLLA 



37 6 CGTCGCCCGCCGCCGCGCCTTCGCCGTCCTCGTCCTCGGTCTCCTCGTCGTCGGCCACGGCTCGCTCCTCGGTGG 4 50 
SPAAAPSPSSSSVSSSSATAPSSVV 

451 TCGCGGCGACCTCCGGCGGCGGGACGCCCGGCCTGGGCAGAGGTCGAAACAGTAACAAAGGACTGGGTCAGT^ 52 5 
AATSGGGRPGLGRGRNSNXGLPQST 

52 6 CGA r TT Cr TTT G ATGGAATCTATGCAAATATGAGGATGGrrCATAT^ S 0 0 

ISfDGIYANMRMVHir-TSVVGSKCE 

601 AAGTACAAGTGAAAAATGGAGGTATATATGAAGGAO'i'r:":' : AAAACTTACAGTCGGAAGTGTGATTTGGTACTTG 67 5 
VQVKNGG I Y EGVF KTYS P KG DLVLD 

67 6 ATGCCGCACATX^GAAAACTACAGAATCCACTTCGGCGCCGAAACGTGAAGAAAT;^ 7 50 

AAHEKSTESSSGPKREEIMESILFK 

751- AATGTTCAGACTTIXrrrCTCXrrACAGTT^ 825 
CSDFVVVQFKDMDSSYAKRDAFTDS 

826 CTGCTATCAGTGCTAAACTGAA1X«X:GAACACAAAGAGAAGGACC^^ 300 
AISAKV NGBHKBKDLB PWDAGELTA 

901 CCAATGAGGAA Cr i ^l ACG CinVTI^ GAAAATGACCTATCTAAYG^ 975 
NBBLBALENDVSNGWDPMDMFRY NB 

976 AAGAAAATTAT G GTrrr A GTGTCTACGTATGATAGCACTTTAavri^ ^ 1050 
ENYGVVSTYDSSLS SY TVPL BRDNS 

1051 CAGAAGAATTTTTAAAACGGGAAGOU^GCXXJUUU: 1125 
EEFLKREARANQLAEEIESSAQYKA 

112 6 CTCGAGTOCSOrCTCGAAAATGATCATAGGACTCAG 1200 
RVALHNDDRSEBEKYTAVQRMSSER 

i 2 0 X GTGAGC»X:ACAGCATAAACACTACCaAAAATAAATATAr:X.CT'C CTCCACAAAGAAATAGAGAAGTCATATCCT 1275 
BGHSINTRBMKYIPPGQRNREV ISW 

127 6 GGGGAAGTGCXSAGACAGAATTCACCCCGTATgGGCCJUSCC^^ 1350 
GSGRQNSPRMGQPGSGSKPSRSTSH 

1351 ACACTTCAGATTTCAACCCGAATTCTGGTTCACACCAJ^ 1425 
TSDFNPNSGSDQRVVNGGVPWPSPC 

1426 GCCCATCT CC T^ ICC r c rx.CK:CCACC.■l■l^,l^ CG CTACCAGTCAGgTCCCAAClV:■C^ICC^ 1500 
PS PS.SRPPSRYQSGP NSLPP RAATP 

1501 CTACAC«X:CGCCCTCCAGGCCCCCCTCGCCCCCATCCAGACCCCCGTCrCA 157 5 

TRPPSR-PPSRPSRPPSHPSAHGSPA 

1576 CTCCTCTCTCTACTATGCCTAAACCCATGTCTTCAGAAGGGCCTCC^ 1650 
PVSTMP KRMSSEG. ? PRMSPKAQR HP 

165 1 GTCGAAATCACAGA O ITl^ w iX^ CTGGGAGCCGTTCCATATCCAGTGGCCTAGAATTTGTATCCCACAACCCACCCA 1725 
RNHRVSAGRGS I SSCLEF'/S HNPPS 
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* w Avj * GCGGTTT 1 3 0 C 

V 3 G 7 ? 

L30 1 tAAGATTATCCCrrAAAACTCATAGACCCAGGTCTCCCACACAGAACAGTATTGGAAATACCCCCAGTGGGCCAG 137 5 
*^-3PKTHR ?RSPR.QN3:GMT?SG?V 

CCAGCTGCATCTCCTACGC 19 50 
? A A S ? T ? 

1951 TTGCTAGTGCTGCATCGAACACAGCTGTTACC GGTTCTAGTGAGGCT.^wkAGATTCr AGGCTTCAAGATCAGAGGC ZZZl 

^ ? s .V R A ■/ T ? s s E A :< 3 = l z o q r q 

202 6 AGAACTCTCCTGCAGGGAATAAAGAAAATArrAAACCCAATGAAACa.TCACCTAGCTTCT^ 2100 
NSPAGNKENIKPNETSPSrSKASNK 

2101 AAGGTATATCACCJ^GTTGTTTCTGAACATAGAAJIACAGATTGATGATTTA^ 217 5 

GISPVVSEHRKQlDDLKKrKND-RL 

217 6 TACAGCCAAGTTCTACTTCTGAATCTATGGATCAACTACTAAACAAA^ 2 25 0 

QPSSTSESMDQLLNKNREGEKSR-DL 

2251 TGATCAAAGACAAAATTGAACCAAGTGCTAACGATTCTTTCATTC 2 3 2 S 

IKDKISPSAKDSFIENSSSNCTSGS 

232 6 GCAGCAAGCCGAATAGCCCCAGCATTTCCCCTTCAATACTTAGTAACACG^ 2 4 00 

S KPNSPS I S PS ILSNTEHKRGPEVT 

2401 CTTCCCAAGGGGTTCAGACTTCCAGCCCAGCATGTAAAC^ 2 47 5 

SQGVQTSSPACKQEKDDKEBKKDAA 

247 6 CTGAGCAACTTACGAAATCAACXTTGAATCCCAATGCA^ 2550 
EQVRKSTLNPNAKEFNPRSPSQPKP 

2S51 CTTCTACTACCCCAACTTCACCTCGGCCTCAAGCACM 2 625 

STTPTSPRPQAQPSPSMVGHQQPTP 

PIYGGSSTA^fS 

2626 CAGTTTATACTCACCCTCTTTGTTTTGCACCAAATATGATG^ 2700 
VYTQPVCFAPNMMVPVPVSPGVQYQ 

2701 AAATATGCCCCAACAGCGGCAAGACCACCATCATCAGAGTCy:CATGATGCACC 2775 
ICPN SGKTSIIRVP 
^MPQ QRQDQHHQSAMHHPASAAGPP 

2776 GATTtXZAGCCACCCCACCaCCTrACTCCACCCAATAT G T ^^ 2850 
X A A T P P A Y S T Q Y V A YSPQQFP^QPL 

2 851 TGTTCAGCATCTKKXJICXTTATCAGTCTCA^ 2925 

^QHVPHYQSQSPHVYSPVIQGifARM 

2926 GATCCCACCACCAAX:ACACGCCCAGC C T t^Xn ' iA GTA IC ' : ' lV:^r,A C^^ 3000 
i^APPTHAQP GLVSSSATQYGAHEQT 

3001 GCATGCGATCTATGCATgTCCCJU^TTACCATACAAC:^ m ' M rACi - 1 ' lX. CCATTTCCAC 3075 

itAH YACPKL PYNKETSPSFY FA IS T 

307 6 GGCKrrcCCTTGCTCAGCACTATCCCCACCCTAACCCTXCCCTGCAC 3150 
G S LA Q 'Q Y A H PSA T L H P H T P H P Q P S A 

3151 TACCCCCACTCGACACCACCAAAGCCAACATGGTGGAAGTCATCC^ 3 225 

TP7G QQQSQHGGSHPAPSPVQHHQH 

3 226 CCACGCCGCCCACKKrrCTCCATCTCCCCACTCC^^ 3 3 00 

QAAQALHLASPQQQSAIYH'AG LAPT 

3 301 TCCACCrTCCATGACACCTGCCTCCAACACCCAGTCGCCACAGAATAGTTTC 3 3 7 5 

PPSMTPAS:/TQSPQ,VSF?AAOQrVF 



figure 7 (suite 1) 

"^CC - . CCTCCj-iC *. AGCAAGGACCAi^-i k . . C wwGGGGAACGT jGTTATTAGt 
AT ? ? •/ A R T 3 ? 3 G G • T W 3 3 '/ 



137 6 TTCTTGCTTCTCCGCAAGCTGGTATTATTCCAACTGAAGCTGTTGCCAT 
- A S ? Q A G : ; ? T Z A V A M 
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figure 7 (suite 2 et fin) 

2 J " T 7ACwATCCATCCTTCTCACCTTCACCCCCC3TATACCAACCCACCCCACATCGCCCACCTACCT'ZACCCTCATCT --450 

T : H ? S H V Q ? A Y T iV P ? H A H ■*/ P V 

3 4 51 ACAGTCACy^AATGCTTCrrrCTCATCCAACTGCCCATGCGCCAATGATGCr AATGAC 3 5 : S 

OSG.YV^?S/fPrA//A P M L r T 0 ? ? G G 

3 5 2 6 TCCCCAGGCCGCCCTCGCTCAAA<rrGCACTACACCCCATTCCAGTCTCGACAACAGCGC^ 3 600 
PQAALAQSALQPIPVSTTAHrprHT 

3 6 0 : GCACCCTTCACTACAAGCCCACCACCAACAGCAGTTCT^GCCTGCCrTGGAGCAACC 3 6 7 « 

3 6 7 S C CTCCCTTCTACTGCTTCTACCAACTGCAAGCACAGAAAACTAGA^ 3 7 50 

3751 TGTTGA'rr rC ' l ' l ' G i AACATCCAATAGGAATGCTAACACTTCACTTGCACTGGAAGATACTTGGACCGAGTAGAGG 3 8 25 

3 82 6 CATTTAGGAACTTCGGGGCTATTCCATAATTCCATATGCTGTTTCAGAGTCCCGCAGGTACC 3 900 

3 901 CCGAAACTGGAAGrrATTrA l ' l ' I ' i - rT AATAACCCrniAAAGTCATGAA 3 9 75 

3 97 6 GAGTGATTCTTGCrSCTArTACTTGCTAAAAAAAAAAAA-^^ 4 050 

40 SI rACTAAACTTGACAAAOTrTCAGrAAArrCTTACCGTXZAAAC^ 4125 

4126 AGgTCArCACTGTCTA CA G 1 Wi*rCAA C ' r TT A AGTTA 4163 
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K. IDE ET AL.: "Abnormal gene product 

identified in Huntington's disease 

lymphocytes and brain." 

voir le document en entier 

NATURE, 
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expansion as a pathological epitope in 

Huntington's disease and four dominant 

cerebellar ataxias." 

voir le document en entier 

HUMAN MOLECULAR GENETICS, 

vol. 5, no. 12, Decembre 1996, OXFORD, 

GRANDE BRETAGNE, 

pages 1887-1892, XPO02027564 

G. STEVANIN ET AL. : "Screening for 
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voir le document en entier 
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Demande intemationale n" 

PCT/FR 96/01773 



Cadre I Observations - lorsqu*il a etc estime que certaines revendications ne pouvaient pas faire I'objet d'uDc recherche 
(suite du point 1 de la premiere feuille) ^ 



Conformement a rarticle I7.2)a), certaines revendications n*ont pas fait Tobjet d'une recherche pour les motifs siuvants 



□ 



Les revendications n" 24 i. u • 

se rapportcnt a un objet a i'egard duquel radministration n^est pas tenue de proceder a la recherche, a savoir 

Remarque- B1en que la revendlcatlon ^^ (pour autant quMI s'agit d'une 
methode in vivo) concerne une methode de diagnostic appHque au corps 
humain/animaU la recherche a ete effectuee et absee sur les effects 
imputes au produit/a la composition. 

Les revendications n** j 
se rapportenl k des parties de la demande intemationale qui ne remplissent pas suffisamment les conditions prescntes pour 
qu'une recherche significative puisse etre effectuee, en particiilier ; 



3. I I Les revendications n** . j ■ j i 

I I sont des revendications dependantes et ne sont pas redigees conformement aux dispositions de la deuxieme et de la 

troisieme phrases de la regie 6. 4. a). 



Cadre D Observations - lorsqu'il y a absence d'unite de Tinvention (suite du point 2 de la premiere feuille) 



L' administration chargee de la recherche intemationale a trouve plusieurs inventions dans la demande intemationale, a savoir : 



1. I I Comme toules ies taxes additionneiles ont ete payees dans les delais par le d^posanl, le present rapport de recherche 
— intemationale porte sur toutes les revendications pouvant faire P objet d'une recherche. 

2. I I Comme toutes les recherches portant sur les revendications qui s'y pretaient ont pu etre effectuees sans effort pariiculier 
I — ' justifiant une taxe additionneUe, radministration n*a sollicite le paiement d'aucune taxe de cette nature. 

3 . j I Ccanme une partie seulement des taxes additionneiles demanddes a et6 payee dans les delais par le deposant. le present 
' — ' rapport de recherche intematioiwle ne porte que s\ir les revendications pour lesquelles les taxes ont 6t^ payees, a savoir 

les revendications n** : 



□ Aucune taxe additionnelle demand^e n'a t\t pay6e dans les delais par le deposant. En consequence, le present rapport 
de recherche intemationale ne porte que sur Tinvention mentionn6e en premier lieu dans les revendications, elle est 
couverte par les revendications n" : 



Remarque quant a la reserve [ | Les taxes additionneiles etaient accompagnees d'une reserve de la part du deposant 

I I Le paiement des taxes additionneiles n'^tait assorti d* aucune reserve. 
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